如果没有经过适当的处理和优化,WordPress博客中将有很多内容重复的页面,而这些重复内容会不利于搜索引擎的索引。本文整理和归纳了关于“重复收录“的一些资料和好的建议,将全面分析“解决博客内容被重复收录“的途径:
1. WordPress博客中有哪些“重复内容“
(a) 首页显示的文章与独立文章页面的重复(特别是首页输出全文的blog)
(b) 分类页面和独立文章页面的重复:在WP博客中,可以通过分类页和存档页来访问一篇文章,因此你的某篇文章会有不止一个url(如下), 从而造成重复收录。
www.yoursite.com/2008/01/post-name
www.yoursite.com/category/wordpress
http://www.veryhuo.com
(c) 对于很多博客,www.yoursite.com和 yoursite.com都可以访问,而没有做跳转,你访问这两个地址将得到同样的结果,相当于整个站的重复。
(d) 在google眼中,www.example.com/page 和 www.example.com/page/是不同.
(e) 文章内容和feed内容的重复,比如:
www.yoursite.com/2008/01/post-name
www.yoursite.com/2008/01/post-name/feed。
如何避免博客内容的重复收录:
(1)设置你的All in One SEO插件。
(2)在服务器上添加robots.txt文件。
这是别人的方法。我没有采用。我是在谷歌网站管理员工具里设置,让谷歌蜘蛛不抓取我网站的重复内容。在管理员工具设置里,忽略某些内容的抓取。最重要的是tag标签,它是wordpress博客中最重要的重复源。
你还可以添加自定义参数。这些自定义参数从哪来呢?site你的域名,把那些与你的博客的固定链接,不同的目录复制粘贴过去就可以了。就像下图中的,我的固定链接是域名加数字加html形式。那些域名后面带的拼音标签一律都是要k的对象。