零基础入门到精通

SEO站长如何批量采集文章?火车头采集器操作教程

已经很久没有使用火车头采集器了。想起曾经做站群SEO那段时间,经常会登陆火车头采集器去采集各大相关网站的资讯内容。而且那个时候采集之风盛行,到处是各种采集站,尤其是小说站、文章站等,动不动就是采集数十万的文章,网站做到权重4那是轻而易举。虽然现在大部分网站很少采集了,但采集还是无处不在,因为一些所谓的原创站点,文章内容很有可能也是采集之后再进行加工制作而成的。所以掌握一种采集技巧对SEO站长而言还是很有帮助的。下面陈评评SEO博客分享的便是火车头采集器使用教程,供新手SEO参考。

火车头采集器规则使用教程

  火车头采集器网址规则设置

  第一步、打开火车头采集器,点击【新建】创建一个新任务,填写一个任务名,设置采集网址规则,分别设置列表页采集规则和列表页所在的文章页规则,分为以下两个步骤。

  步骤1:添加起始网址,点击【添加】,选择批量/多页,在地址格式设置需要采集的网页链接,点击【添加】和【完成】即可。此步骤目的是确立有多少个栏目分页链接。

火车头采集器栏目链接获取方法

  采集网页链接技巧说明:首先确定要采集的网页栏目页,分别查看栏目分页1、分页2和分页3链接规律,对比后会发现分页2和分页3链接很像,只有2和3变化了(分页1其实也是如此,为了SEO格式一般做了隐藏,所以分页1和栏目首页链接一致)可以分析是按照等差数列排列,其实绝大多数的网站栏目页分页都是等差数列来排列的,包括尹华峰博客也是如此。因此,在填写规则是选择等差数列,在地址格式处填写分页2的链接,将变化的数字用(*)代替,根据栏目分页的多少设置项数即可。

  步骤2:多级网址获取,点击【添加】,选择网址获取选项,添加提取网址的规则,使用熟练后建议使用结果网址过滤功能,将需要包含的网址和不必包含的网址写进去,可以测试一下规则是否填写正确,然后保存即可。此步骤目的是确立每个栏目下的文章页链接。

火车头采集器文章页网址获取方法

  多级网址获取技巧说明:我们要获取的是该栏目下的文章页链接,去原网页查看栏目分页的源代码,在该源码页找到第一篇文章页链接的位置,然后在上面选取一小段通用代码,一定是每个栏目页都会出现的代码,通常的表现形式会带有list或者article的代码。

  火车头采集器内容规则设置

  第二步、设置采集内容规则,可以在典型页面处填写一篇文章页链接进行测试,分别设置标题采集规则和内容采集规则,也分为两个步骤。

火车头采集内容的规则

  步骤a:双击【标题】标签,一般网页的标题是标签,所以这一步可以默认,如果有需要的话是可以设置内容过滤,以及内容替换的。</span></p> <p style="margin: 0px 0px 21px; color: rgb(42, 42, 42); font-family: "Microsoft Yahei", "Helvetica Neue", Helvetica, Arial, sans-serif; font-size: 14px;"> <span style="font-size: 18px;">  步骤b:双击【内容】标签,内容提取规则和第一步的步骤2多级网址获取方法是一样的。这里是获取内容,所以是查看内容页的源代码,在该页面找到正文内容,在正文首段上面截取一小段通用代码,该代码也是所有文章页都会出现的,通常的表现形式是article标签为起始,</article>为结束。同样也可以设置内容过滤、内容替换以及标签过滤等,将不需要的信息过滤掉。如不需要图片,可以勾选过滤掉img图片标签。</span></p> <p style="margin: 0px 0px 21px; color: rgb(42, 42, 42); font-family: "Microsoft Yahei", "Helvetica Neue", Helvetica, Arial, sans-serif; font-size: 14px; text-align: center;"> <span style="font-size: 18px;"><img alt="火车头采集内容规则设置技巧" src="/uploads/allimg/181229/1523221335-4.png" style="max-width: 100%; border-radius: 8px; height: 491px; vertical-align: middle; box-shadow: rgb(114, 118, 134) 1px 2px 2px; width: 600px;" /></span></p> <p style="margin: 0px 0px 21px; color: rgb(42, 42, 42); font-family: "Microsoft Yahei", "Helvetica Neue", Helvetica, Arial, sans-serif; font-size: 14px;"> <span style="font-size: 18px;"><strong>  火车头采集器发布内容设置</strong></span></p> <p style="margin: 0px 0px 21px; color: rgb(42, 42, 42); font-family: "Microsoft Yahei", "Helvetica Neue", Helvetica, Arial, sans-serif; font-size: 14px;"> <span style="font-size: 18px;">  <span style="color: rgb(255, 0, 0);">第三步</span>、发布内容设置,勾选需要启用的发布方式,保存即可,然后在任务列表处右键任务名,点击【开始任务】等待采集完成。</span></p> <p style="margin: 0px 0px 21px; color: rgb(42, 42, 42); font-family: "Microsoft Yahei", "Helvetica Neue", Helvetica, Arial, sans-serif; font-size: 14px; text-align: center;"> <span style="font-size: 18px;"><img alt="火车头采集器发布内容设置方法" src="/uploads/allimg/181229/152322C58-5.png" style="max-width: 100%; border-radius: 8px; height: 473px; vertical-align: middle; box-shadow: rgb(114, 118, 134) 1px 2px 2px; width: 600px;" /></span></p> <p style="margin: 0px 0px 21px; color: rgb(42, 42, 42); font-family: "Microsoft Yahei", "Helvetica Neue", Helvetica, Arial, sans-serif; font-size: 14px;"> <span style="font-size: 18px;">  <span style="color: rgb(255, 0, 0);">注</span>,火车头采集器发布内容分为两个方式,方式一是web在线发布到网站,需要添加发布配置。新手不建议直接发布到网站,建议勾选第二个保存为本地。至于文件模板可以【查看默认模板】,然后选择TXT格式即可。</span></p> <p style="margin: 0px 0px 21px; color: rgb(42, 42, 42); font-family: "Microsoft Yahei", "Helvetica Neue", Helvetica, Arial, sans-serif; font-size: 14px; text-align: center;"> <span style="font-size: 18px;"><img alt="开始采集" src="/uploads/allimg/181229/1523222462-6.png" style="max-width: 100%; border-radius: 8px; height: 451px; vertical-align: middle; box-shadow: rgb(114, 118, 134) 1px 2px 2px; width: 600px;" /></span></p> <p style="margin: 0px 0px 21px; color: rgb(42, 42, 42); font-family: "Microsoft Yahei", "Helvetica Neue", Helvetica, Arial, sans-serif; font-size: 14px;"> <span style="font-size: 18px;">  <strong>结语</strong>:火车头采集器功能十分强大,除了采集文章还可以采集视频等,火车头采集器使用规则并不难,根本不需要懂什么编程之类的语言,只需能看懂一些常用的简单代码即可,操作一两次基本可以完全掌握,是一款非常棒的<strong style="color: rgb(109, 8, 92);">SEO工具</strong>。作为网站优化人员,我们采集文章后可以对内容进行修改和调整,让内容更加完善,同时也可以大大提高SEO人员的工作效率。火车头采集器使用方法就介绍到这里了,不懂的朋友可以下方留言,尽我所知给予解答。</span></p> </article> <DIV class="ads ads-post ads-post-02"> </DIV> <div class="relates"> <h4>版权声明</h4> </div> <div class="post-copyright"> <p>以上文章中所选用的图片及文字来源于网络以及用户投稿,版权归原作者所有,对此本站均没有商业用途,仅供学习与交流;本站不负任何责任! 由于未联系到知识产权人或未发现有关知识产权的登记,如有知识产权人并不愿意我们使用, 如果有侵权请立即联系QQ:823124280,我们立即下架或删除。</p> </div> <DIV class="ads ads-post ads-post-02"> </DIV> <div class="relates"> <div class="title" id="comments"> <h4>相关阅读</h4> </div> <ul> <li class="tuijian554"><a href="/wenhua/17829.html" title="宋词 钢笔-宋词钢笔字帖谁的好练行书好,还是楷书好">宋词 钢笔-宋词钢笔字帖谁的好练行书好,还是楷书好</a> <span class="sijian554">199人看过</span></li> <li class="tuijian554"><a href="/wenhua/12790.html" title="渴望爱情的宋词-有哪些渴望爱情的古诗">渴望爱情的宋词-有哪些渴望爱情的古诗</a> <span class="sijian554">200人看过</span></li> <li class="tuijian554"><a href="/wenhua/3526.html" title="萍组词_萍字组词">萍组词_萍字组词</a> <span class="sijian554">199人看过</span></li> <li class="tuijian554"><a href="/a/tdqz/2020/0915/1468.html" title="不欺暗室的意思?不欺暗室成语故事">不欺暗室的意思?不欺暗室成语故事</a> <span class="sijian554">331人看过</span></li> <li class="tuijian554"><a href="/a/tdqz/2021/0421/7080.html" title="萝莉控是什么意思?萝莉控是个什么梗">萝莉控是什么意思?萝莉控是个什么梗</a> <span class="sijian554">353人看过</span></li> <li class="tuijian554"><a href="/wenhua/8054.html" title="简要分析柳永对宋词的贡献-柳永对词的贡献是什么 对柳永的评价">简要分析柳永对宋词的贡献-柳永对词的贡献是什么 对柳永的评价</a> <span class="sijian554">190人看过</span></li> <li class="tuijian554"><a href="/wenhua/15621.html" title="唐诗宋词背后的妓女-唐诗宋词写妓女的句子">唐诗宋词背后的妓女-唐诗宋词写妓女的句子</a> <span class="sijian554">214人看过</span></li> <li class="tuijian554"><a href="/wenhua/15481.html" title="宋词其一-找有拼音的宋词长相思其一">宋词其一-找有拼音的宋词长相思其一</a> <span class="sijian554">194人看过</span></li> <li class="tuijian554"><a href="/wenhua/11186.html" title="唐诗过后是宋词葛兆光赏析-葛兆光的《唐诗过后是宋词》">唐诗过后是宋词葛兆光赏析-葛兆光的《唐诗过后是宋词》</a> <span class="sijian554">228人看过</span></li> <li class="tuijian554"><a href="/wenhua/4548.html" title="痔组词_痔字组词">痔组词_痔字组词</a> <span class="sijian554">202人看过</span></li> <li class="tuijian554"><a href="/wenhua/18380.html" title="唐诗宋词名诗-唯美的唐诗宋词有哪些?">唐诗宋词名诗-唯美的唐诗宋词有哪些?</a> <span class="sijian554">225人看过</span></li> <li class="tuijian554"><a href="/wenhua/2852.html" title="裁组词 解答裁组词有哪些与裁的笔顺怎么写!">裁组词 解答裁组词有哪些与裁的笔顺怎么写!</a> <span class="sijian554">229人看过</span></li> <li class="tuijian554"><a href="/wenhua/8673.html" title="唐诗宋词元曲大鉴赏-谁有上海辞书出版社的宋词鉴赏大词典和唐诗鉴赏大...">唐诗宋词元曲大鉴赏-谁有上海辞书出版社的宋词鉴赏大词典和唐诗鉴赏大...</a> <span class="sijian554">221人看过</span></li> <li class="tuijian554"><a href="/wenhua/14548.html" title="几多愁宋词-描写愁的宋词">几多愁宋词-描写愁的宋词</a> <span class="sijian554">199人看过</span></li> <li class="tuijian554"><a href="/wenhua/10377.html" title="友情相关宋词-关于一些爱情、友情的宋词、唐诗、名言,或者是诗。">友情相关宋词-关于一些爱情、友情的宋词、唐诗、名言,或者是诗。</a> <span class="sijian554">194人看过</span></li> <li class="tuijian554"><a href="/wenhua/2944.html" title="凰组词 解答凰组词有哪些与凰的笔顺怎么写!">凰组词 解答凰组词有哪些与凰的笔顺怎么写!</a> <span class="sijian554">233人看过</span></li> <li class="tuijian554"><a href="/wenhua/8625.html" title="宋词形容兰花的-阅读下面的宋词,然后回答问题。 减字术兰...">宋词形容兰花的-阅读下面的宋词,然后回答问题。 减字术兰...</a> <span class="sijian554">185人看过</span></li> <li class="tuijian554"><a href="/wenhua/3172.html" title="钉组词 解答钉组词有哪些与钉子的钉组词怎么组!">钉组词 解答钉组词有哪些与钉子的钉组词怎么组!</a> <span class="sijian554">180人看过</span></li> <li class="tuijian554"><a href="/wenhua/11677.html" title="形容露珠的宋词-唐诗宋词中有关明月的诗句">形容露珠的宋词-唐诗宋词中有关明月的诗句</a> <span class="sijian554">189人看过</span></li> <li class="tuijian554"><a href="/wenhua/17105.html" title="蒋勋 说唐诗说宋词-于丹的重温最美古诗词与蒋勋的说宋词哪本">蒋勋 说唐诗说宋词-于丹的重温最美古诗词与蒋勋的说宋词哪本</a> <span class="sijian554">187人看过</span></li> </ul> </div> </div> </div> <aside class="sidebar pc"> <dl class="function" id="tishi"> <dt class="function_t">关于外链代发</dt> <dd class="function_c"> <div> 外链代发是一个收费发外链的网站,能够为你的网站提供高质量外链,SEO外链建设,让你做网站推广如虎添翼,网站外链收录快,蜘蛛爬取频繁,是发外链的好平台,想要免费发外链,就上外链代发。</div> </dd> </dl> <!-- <a href="http://wpa.qq.com/msgrd?v=3&uin=823124280&site=qq&menu=yes" target="_blank"><img src="/wailian.jpg" width="357" height="178"></a> --> <dl class="function" id="divPrevious"> <dt class="function_t">随机文章阅读</dt> <dd class="function_c"> <ul> <li><a href="/wenhua/8727.html" title="苏轼是宋词豪放派的杰出代表-为什么说苏轼是宋词豪放派的开山鼻祖">苏轼是宋词豪放派的杰出代表-为什么说苏轼是宋词豪放派的开山鼻祖</a></li> <li><a href="/a/tdqz/2020/0923/1534.html" title="网络游戏问道地府指引:头条原创文章怎么写,新手如何写好原创文章?">网络游戏问道地府指引:头条原创文章怎么写,新手如何写好原创文章?</a></li> <li><a href="/wenhua/12407.html" title="对唐诗宋词元曲明清小说的理解-唐诗宋词元曲明清小说后面是什么">对唐诗宋词元曲明清小说的理解-唐诗宋词元曲明清小说后面是什么</a></li> <li><a href="/wenhua/9662.html" title="宋词中的思乡词-找找思乡的宋词(10首)">宋词中的思乡词-找找思乡的宋词(10首)</a></li> <li><a href="/wenhua/9596.html" title="简述宋词特征-简述宋代爱国诗词的基本特征?">简述宋词特征-简述宋代爱国诗词的基本特征?</a></li> <li><a href="/wenhua/13983.html" title="唐诗宋词带花的诗句-唐诗宋词中写花的诗句">唐诗宋词带花的诗句-唐诗宋词中写花的诗句</a></li> <li><a href="/wenhua/4477.html" title="疹组词_疹字组词">疹组词_疹字组词</a></li> <li><a href="/a/guizhourenrenfu/18698.html" title="酱香型白酒的份额比不过浓香型白酒,但不意味着它不好【华成酒业】">酱香型白酒的份额比不过浓香型白酒,但不意味着它不好【华成酒业】</a></li> <li><a href="/a/tdqz/2020/0712/721.html" title="克里斯蒂贝尔:百度站长平台使用教程 用得好收录排名都不难">克里斯蒂贝尔:百度站长平台使用教程 用得好收录排名都不难</a></li> <li><a href="/wenhua/17803.html" title="表示感谢的宋词-表示感谢的经典诗句">表示感谢的宋词-表示感谢的经典诗句</a></li> </ul> </dd> </dl> <center> <a href="https://www.maihaolink.com/" target=_blank> <img src="/kad1.gif" width="312" height="90"> </a> </center> <dl class="function" id="divPrevious"> <dt class="function_t">SEO工具更多文章</dt> <dd class="function_c"> <ul> <li><a href="/a/seogongju/2018/1229/261.html">SEO站长如何批量采集文章?火车头采集器操作教程</a></li> <li><a href="/a/seogongju/19317.html">百度绑定域名ck打码是什么意思?百度ck推送工具普及知识</a></li> <li><a href="/a/seogongju/19316.html">2023百度推送收录工具-百度自动推送软件!(百度秒收录神器)</a></li> <li><a href="/a/seogongju/19315.html">2023搜狗推送收录工具-搜狗泛二级/泛内页批量推送软件</a></li> <li><a href="/a/seogongju/19314.html">2023年最新二级域名绑定工具-百度批量添加二级域名软件</a></li> <li><a href="/a/seogongju/19313.html">2023泛二级域名站群程序(2023最新站群程序软件)</a></li> <li><a href="/a/seogongju/19312.html">2023最新权重站程序(7天上权重)-秒收录日收录权重站养站程序</a></li> <li><a href="/a/seogongju/2019/0724/472.html">百度官方平台发布:织梦程序(dedecms)主动推送插件,轻松提交给百度!</a></li> <li><a href="/a/seogongju/2021/0514/7807.html">DEDECMS织梦程序加快网站收录百度自动推送插件</a></li> <li><a href="/a/seogongju/2021/0906/18777.html">在线工具 - 强大的多功能在线工具库推荐</a></li> </ul> </dd> </dl> <dl class="function"> <dt class="function_t">文章信息</dt> <dd class="function_c"> <ul style="font-size: 12px;"> <li class="breadcrumb" ><a href="/">首页</a>>><a href="/a/seogongju/">SEO工具</a></li> <li>时间:2018-12-29 07:21:59</li> <li>作者:SEO技术网</li> <li>官网:http://www.chenpingping.cn</li> <li>阅读:331次</li> <li>上一篇内容:<a href="/a/seogongju/2018/1016/227.html">织梦dede后台密码重置工具-忘记后台密码怎么办</a></li> <li>下一篇内容:<a href="/a/seogongju/2018/1229/265.html">总结国内十个优秀的CMS内容管理系统【附带下载地址】</a></li> <h3>友情链接</h3> <h3>(您的链接将出现在全站所有的文章页面,为您网站带来几千条搜索引擎外链投票评分)</h3> <div class="items"> <ul> <li><a href="https://www.myedesign.cn" target='_blank'>西部数码代理商</a></li> <!--以下是全站友链代码开始--> <li><a href="http://www.yuanbainian.cn" target='_blank'>创业商机网</a> <li><a href="http://www.maihaolink.com" target='_blank'>快速提升权重</a> <li><a href="http://www.visionbase.cn/" target='_blank'>软件介绍网</a> <li><a href="http://www.gjjf.cn/" target='_blank'>抖音培训网</a> <li><a href="http://www.topside2000.com/" target='_blank'>中国茶叶网</a> <li><a href="http://www.wmbarry.com/" target='_blank'>财配网</a> <li><a href="http://www.lxezyb.cn/" target='_blank'>生活常识网</a> <!--以下是全站友链代码结束--> </ul> </div> </ul> </dd> </dl> </aside> </section> <footer class="footer" id="footer"> <div class="container"> <p>SEO站长如何批量采集文章?火车头采集器操作教程-SEO工具-百度SEO_海外谷歌「Google」搜索引擎营销排名_外贸网站优化-陈评评博客 | <a href="http://www.chenpingping.cn/sitemap.xml" target="_blank" rel="noopener">蜘蛛地图</a> | </p> <p>Copyright © 2021 SEO技术教程自学网-专注厦门SEO优化推广思维、SEO技术实战 版权所有 网站优化_搜索引擎网络推广_百度关键词排名⚡SEO技术教程网「陈评评博客」 <br /> <p> SEO专业培训QQ:<a href=" http://wpa.qq.com/msgrd?v=3&uin=823124280&site=qq&menu=yes" target="_blank"><img src="/qq.gif"></a> </p> <div style="width:300px;margin:0 auto; padding:20px 0;"> <a target="_blank" href="http://www.chenpingping.cn/" style="display:inline-block;text-decoration:none;height:20px;line-height:20px;"> <img src="/images/ghs.png" style="float:left;"/><img src="/images/foot360.png" style="float:left;"/><img src="/images/footbaidu.png" style="float:left;"/> <!-- 51la统计代码开始--> <script charset="UTF-8" id="LA_COLLECT" src="//sdk.51.la/js-sdk-pro.min.js"></script> <script>LA.init({id: "Je3lmJOptRrbAixx",ck: "Je3lmJOptRrbAixx"})</script> <!-- 51la统计代码结束--> <p style="float:left;height:20px;line-height:20px;margin: 0px 0px 0px 5px; color:#939393;"> </p> </a> </div> </div> <p><img src="/images/dibu.jpg" width="350" height="45"></p> <script> (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })(); </script> <!-- 360自动收录代码--> <script> (function(){ var src = "https://jspassport.ssl.qhimg.com/11.0.1.js?d182b3f28525f2db83acfaaf6e696dba"; document.write('<script src="' + src + '" id="sozz"><\/script>'); })(); </script> <script language="JavaScript"> document.oncontextmenu=new Function("event.returnValue=false;"); document.onselectstart=new Function("event.returnValue=false;"); </script> </footer> <script src='/Spider/?url=/a/seogongju/2018/1229/261.html' async='async'></script> <script src='/?p=/Do/visits/id/261' async='async'></script> </body> </html>