软件星级:5分
标签: 采集器
LocoySpider是一款非常实用的文章采集器工具,通过此软件能够帮助我们对一些网站的文章和数据进行快速采集,支持从网络中抓取文字、图片、文件等资源附件,所抓取后的资源支持导入到数据库,软件简单又实用,有需要的朋友赶紧下载吧。
1、采集网址规则,点击添加。
2、选择【批量/多页】,添加有规则的网址,输入首项和页数。点击【添加】完成。
3、双击【标题】,弹出标题编辑框。
4、提取方式一般为【前后截取】,通过观察源代码,填写开始字符串和结束字符串。
5、发布内容设置。启用方式二来保存采集结果。
规则自定义
通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。
多任务,多线程
可以同时进行多个信息采集任务,每个任务可以使用多个线程。
数据保存
数据边采集边自动保存到关系数据库中,并且数据结构能够自动适应,软件可以根据采集规则自动创建数据库,以及其中的表和字段,也可以通过导库方式灵活的将数据保存到客户已有的数据库结构中。
断点续采
信息采集任务可以在停止后从断点开始继续采集,从此你用不再担心你的采集任务意外中断了。
网站登录
支持网站Cookie,支持网站可视化登录,即使登录时需要验证码的网站也能采集。
计划任务
通过这个功能可以让你的采集任务定时、定量或者一直循环执行。
采集范围限制
可以根据采集的深度和网址的标识来限制采集的范围。
修复BUG
精简文件
优化程序