高级会员交流区贵宾VIP会员交流区



功能特点:
1. 依托于水淼软件独家万能正文识别智能算法,可实现任何网页正文自动提取准确率95%以上。
2. 只需输入关键词,就能采集到微信文章、今日头条、一点资讯、百度新闻和网页、搜狗新闻和网页、360新闻和网页、谷歌新闻和网页、必应新闻和网页、雅虎新闻和网页;可批量关键词全自动采集。
3. 可定向采集指定网站栏目列表下的所有文章(如百度经验、百度贴吧),智能化匹配,无需编写复杂规则。
4. 文章转译功能,可对采集好的文章,将其翻译到英文再翻译回中文,实现翻译伪原创,支持谷歌和有道翻译。
5. 史上最简单最智能文章采集器,更多特点一试就知!

下载地址:
游客,如果您要查看本帖隐藏内容请回复


升级记录(2019年3月31日):
2.10.0.0:修复部分情况因系统原因无法跳转网址导致百度网页无法采集的问题;新增自动去除网址的#后缀部分,该部分会导致网页读取错误;采集文章URL新增左边和右边插入选项;修复前面版本导致的正文提取的过滤存在的一些问题;其他更新。
2.10.1.0:增强对部分采用<meta>跳转的网页识别。
2.10.2.0:增加标题字数限制为最多100字,以免字数超长导致的一些问题;其他更新。
2.10.3.0:修复必应新闻采集失败问题;修复部分网页的分页格式错误导致重复采集的问题;更换网页访问方式(以前https使用WiniNet,http使用WinHttp,现在都用WinHttp);其他更新。
2.10.5.0:修复软件对部分网页跳转代码错判而读取失败的问题;采集文章URL列表栏目的导入导出配置功能新增支持同步导入导出根据URL采集文章栏目的配置。
2.11.0.0:新增动态加载的列表页URL的采集功能(如今日头条toutiao.com);读取网页时增加USC2解码(如新浪微博需要解码才能采集);其他多项更新。
2.11.1.0:文章查看器的文件列表框改进以便看全长标题,并且如果读取的文件数量不全,请在切换目录读取时按住Ctrl键即可增强读取;采集文章URL列表的导入导出配置增加对生成列表页URL和采集列表页URL的配置同步功能(各窗口处于打开状态才能同步配置)。
2.11.2.0:修复过滤正文功能遇到个别网页的特殊代码过滤不正常的问题。
2.11.3.0:修复部分DZ论坛自动识别错误的问题;修复删除外层代码时个别页面自动识别错误的问题
2.11.3.1:修复class过滤的一个细节问题;默认打勾删除外层代码
2.12.0.0:增强分页采集对分页的识别能力(尤其是图片类的分页);生成列表页功能新增支持倒序生成
2.12.1.0:新增采集列表页的文章URL时支持POST方法
2.13.0.0:文章保存格式全新增加txt带图片排版;新增图片二次加载的新属性识别 data-original;文章来源改为在文章末尾追加;新增智能忽略版权信息被识别为正文;调整界面组件位置;其他更新。
2.13.1.0:修复xp系统不能采集淘宝网页的问题;修复//类型链接转换错误问题;更新谷歌地址前缀文件。
2.13.2.0:修复txt格式保存时没有自动转换网页转义符的问题
2.13.3.0:新增【优先标题标签.txt】外部配置文件以解决一些混乱网页识别标题错误的问题
2.13.8.0:【采集文章URL列表】新增ContentType自定义设置支持以解决有些网页之需(该设置位于【采集列表页URL】);新增【指定标题位置.txt】外部配置文件,自动识别不了标题时能手动指定标题的开始和结束标记;搜狗修改为每页10个网址采集,并新增搜狗验证码识别弹出;其他更新。
2.13.9.0:修复关键词采集完全无结果时陷入死循环的问题。
2.13.10.0:采集列表页URL功能新增高级参数(两个值用空格隔开,如果值1空白自动使用值2)。
2.15.0.0:URL采集文章面板的精确标签新增模糊匹配功能;新增计划任务功能,可以设定多个时间点,到点自动开始采集(当前被显示面板的开始采集)。
2.15.1.0:修复微信采集失败问题。
2.15.2.0:修复360网页和新闻的部分问题。
2.15.3.0:搜索引擎读取增加超时50秒设置;尝试修复部分情况下关键词采集崩溃的问题。
2.15.5.0:采集文章URL列表,新增来路设置;更新谷歌镜像地址。
2.15.8.0:修复百度网页搜索时间设置失效问题并取消百度新闻时间设置(已不支持);微信采集时增加正文最少字数的设置支持(原先只有自动识别的可以设置字数,而微信是内置精确标签的所以不能设置字数,现在可以了);【文章查看】切换显示时增加自动刷新目录树;关键词采集正文字数不足时补充提示设置的字数值
2.15.9.0:修复360新闻采集失败问题。
2.15.10.0:修复微信采集失败问题。
2.15.11.0:因有道翻译失效且无法更新,故新增百度翻译;其他更新
2.16.0.0:关键字采集文章新增今日头条、一点资讯等自媒体平台
2.16.1.0:修复上次升级导致的采集分页功能异常
2.16.2.0:修复今日头条图片链接问题;微信增加登录采集。
2.16.3.0:修复设置采集篇数时容易出现无法继续采集下一个关键词的问题。
2.17.0.0:修复谷歌无法采集的问题(仍需翻墙);修复百度转译失效问题(更改为搜狗转译,翻译效果最好的人工智能翻译引擎)。
2.17.1.0:对今日头条增加了尝试次数,并且自动线程为1,以避免被限制
2.17.1.1:尝试修复关键词采集出现的数组错误问题
2.17.2.0:修复上次升级导致的采集错误
2.17.3.0:修复百度网页改动无法采集的问题
2.17.5.0:2018年5月24日源码丢失补写,并修复微信和今日头条无法采集的问题(本版本谷歌采集暂时失效。如需使用请使用2.17.3.0版本并翻墙)
2.17.6.0:修复微信文章没有采集到标题的问题
2.17.7.0:修复一点资讯因改动采集失败问题;修复谷歌采集;其他更新
2.18.0.0:修复微信和今日头条采集
2.18.1.0:修复微信采集
2.18.2.0:修复微信采集
2.18.3.0:修复列表页采集一些问题;修复转译

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
不能回贴的会员请到“新人实习”版块,回复五个主题,当回复满5个贴子时,就能快速升级为初级会员,拥有完整的权限来使用整个论坛。
    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    0

    主题

    22

    帖子

    604

    积分

    初级会员

    Rank: 2

    积分
    604
    发表于 2019-4-17 11:51:23 | 显示全部楼层
    沙发
    感谢分享
    不能回贴的会员请到“新人实习”版块,回复五个主题,当回复满5个贴子时,就能快速升级为初级会员,拥有完整的权限来使用整个论坛。

    0

    主题

    18

    帖子

    541

    积分

    初级会员

    Rank: 2

    积分
    541
    发表于 2019-5-24 16:17:01 | 显示全部楼层
    板凳
    可以免费下载吗
    不能回贴的会员请到“新人实习”版块,回复五个主题,当回复满5个贴子时,就能快速升级为初级会员,拥有完整的权限来使用整个论坛。

    0

    主题

    21

    帖子

    558

    积分

    初级会员

    Rank: 2

    积分
    558
    发表于 2019-5-31 10:32:34 | 显示全部楼层
    地板

    感谢分享
    不能回贴的会员请到“新人实习”版块,回复五个主题,当回复满5个贴子时,就能快速升级为初级会员,拥有完整的权限来使用整个论坛。

    0

    主题

    21

    帖子

    549

    积分

    初级会员

    Rank: 2

    积分
    549
    发表于 2019-10-16 22:44:05 | 显示全部楼层
    5#
    谢谢大神分享,谢谢。
    不能回贴的会员请到“新人实习”版块,回复五个主题,当回复满5个贴子时,就能快速升级为初级会员,拥有完整的权限来使用整个论坛。

    0

    主题

    11

    帖子

    525

    积分

    初级会员

    Rank: 2

    积分
    525
    发表于 2019-10-22 11:11:05 | 显示全部楼层
    6#
    写论文有用不
    不能回贴的会员请到“新人实习”版块,回复五个主题,当回复满5个贴子时,就能快速升级为初级会员,拥有完整的权限来使用整个论坛。

    0

    主题

    12

    帖子

    528

    积分

    初级会员

    Rank: 2

    积分
    528
    发表于 5 天前 | 显示全部楼层
    7#
    谢谢楼主分享,找了好久的好东西,下载来学习学习,谢谢啦。
    不能回贴的会员请到“新人实习”版块,回复五个主题,当回复满5个贴子时,就能快速升级为初级会员,拥有完整的权限来使用整个论坛。

    Archiver|手机版|小黑屋|设计软件.在线[SJsoft OnLine.]

    Powered by Discuz! X3.4  © 2001-2013 Comsenz Inc.