软件星级:4分
标签: 网页采集
后羿采集器是一款非常强大又实用的网页抓取采集工具,让我们可以将采集到的内容进行独立保存,让您在浏览完网站的时候可以将别人的内容复制到自己的素材文件夹上,而且还支持多种抓取方式,可以实现单个网页抓取,也可以选择多个HTML页面抓取,还可以手动选择字段,有需要的的朋友赶紧下载吧。
1、提示软件的项目建立方式,这里可以点击创建一个新的抓取项目。
2、可以将一个网页的地址复制到这里,也可以选择从文本上读取多个地址。
3、复制地址以后点击创建任务就可以了。
4、软件自动打开网页,这里有三个选择类型,可以选择列表页、可以选择内容页,点击下一步。
5、在上方的浏览区域选择您需要抓取的网页字段,鼠标点击字段即可。
可以提示您找到本次保存的HTML位置
支持通过您抓取的网页标题设置保存名称
也可以在保存抓取内容的时候自己重命名
提供了Excel2007保存的方式
也可以选择以原来的HTML直接保存
后羿采集器也能从一个文本上添加多个新的抓取地址
抓取的字段是非常多的,可以自己利用鼠标选择
后羿采集器还提供了抓取过滤的设置功能
V3.1.7(正式) 2019-2-18
主要体验改进
【自定义模式】新增JSON采集功能
【自定义模式】新增滑动验证码识别
【自定义模式】优化效率,列表识别速度翻倍
【自定义模式】自动识别网页Ajax点击,自动配置Ajax超时时间,配置任务更方便
【自定义模式】改进算法,选择网页元素更精准
【本地采集】采集速度整体提升10~30%,采集效率大幅提高
【任务列表】重构任务列表界面,大幅提高性能表现,大量任务管理不再卡顿
【任务列表】任务列表加入自动刷新机制,可随时查看任务最新状态