作者:Smileby陌少羽 | 2019-04-21 10:21 |点击:
首先这个规则采集侠默认都是自动识别的,但是自动识别的效果有可能没有自己设置的好,也有可能有的网站采集侠识别不了,如果标题和内容采集侠识别不到那么就什么都采集不到了!所以这里建议是内容规则最好手工设置,而作者和来源规则可以不设置,也可以到采集侠的高级设置菜单里设置成固定的作者以及来源。
标题、作者、来源、内容和分页规则的写法都是一样的,懂得其中一项的写法,其他几项都懂得了,所以这里就以内容规则来举例说明。
采集侠是怎么根据你的规则找到文章内容的呢,其实就是你写个规则告诉它文章从哪里开始,从哪里结束,最后写成规则就是 开始的地方的代码[内容]结束的地方的代码,
比如我要采集站长之家优化栏目里面的文章,打开文章列表中其中一篇,
如:
http://www.chinaz.com/web/2015/0702/418785.shtml
打开后,右键查看源码,通过查看源码找到文章处,你可以通过搜索文章中的句子去找文章所在的大概位置
最后我们把前后的代码做成规则,就是
<div class="article-detail-bd">[内容]</div>
最后点击测试,如果测试成功了点击保存即可采集