replytocom参数导致搜索引擎重复收录的解决办法


大家在使用WordPress的时候,留心的朋友会发现,百度会抓取一些含有?replytocom=的链接。这样一来,就会造成同一个页面被搜索引擎重复收录。而且这个问题似乎是WordPress程序的通病,绝大大部分wordpress主题都是用这种方法来回复评论。

重复收录对网站seo优化的弊端想必大家都是知道的。重复收录,就是搜索引擎重复收录相同内容的页面。大量的重复内容当然是没有意义的,不管是对搜索引擎还是用户,都是非常不好的。

不过这样的问题,在Google搜索结果里却没有收录这样的链接,原因是因为在WordPress头部有这样一句话: rel=’canonical’参数是告诉抓取的搜索引擎蜘蛛,这里面的网址才是标准的符合seo的网址,如此一来,就会避免因为尾部有不同参数而重复抓取的情况。可惜的是,百度目前还不支持这个参数,不知道以后会不会改进。下面来看此问题的解决办法。
wordpress网站中,replytocom参数导致搜索引擎重复收录的解决办法,如下:

打开网站根目录下的robots.txt文件,添加下面内容:

User-agent: *
Disallow: /*?replytocom=*

这个的含义想想大家都理解,就是说任何蜘蛛都禁止抓取带replytocom的参数的URL。

修改完后不能马上生效,因为Robots.txt起效需要一段时间。其实还可以在回复链接上增加nofollow属性。在后面添加rel=”nofollow”就可以阻止蜘蛛爬行这个链接了。但是实现起来比较麻烦,需要对WordPress非常了解才行。

Archives