网络神采是一款轻量级的采集软件,用于快速采集、下载网页数据。软件速度快、好用而且免费。网络神采支持智能采集(不用配规则)、可视化采集(不用看源文件),支持二次开发、分布式部署,为用户的大数据分析、信息化平台,提供稳定、持续、准确的数据资源。
网络神采特点
1、采集强度
支持JS解析、POST分页、登录采集、跨层采集。对于疑难采集页面,有成熟的解决方案。
2、速度快
支持多任务同时运行,每个任务又可以设置多线程,确保运行效率。
3、规模化
支持任务多级分类、批量管理。支持云服务器分布式部署,管理员团队协合。
4、流程化
支持定时采集,任务定时自动启动。通过二次开发,实现流程化的信息采集、信息处理。
5、运行稳定
系统运行稳定,要求“0bug”。目标网页改版后,自动通知管理员。
6、准确性
定制好任务后,采集准确率可达100%,即一条不漏。
网络神采更新日志
1、修复bug:循环采集,如果关键规则采集失败,数据仍被保留。
2、改进细节:“连续采集内容失败已达到 5 次, 任务动作失败!”,只提示一次。
3、修复bug:本地起始地址,修改或清空后,无法保存成功。
4、可视化采集配置,修复bug:使用Geckofx内核时,个别网页,移动鼠标时,元素加亮失败。
5、细化任务日志多处。
6、采集规则,编辑现有条目:如果“所属层次”为空,则保留现有值,不影响保存,以方便保存单条测试任务。