当一个网站内部因网址规范化的问题出现重复页面时,我们可以使用 Canonical 标签进行处理,从而引导搜索引擎收录规范化网址。目前支持站内 Canonical 标签的搜索引擎有 Google,Yahoo 和 Bing。今天,Google 率先支持跨站使用 Canonial 标签处理重复页面。
Google 称,某些网站会遇到多个网站间出现重复页面的情况。例如,一个要启用新域名而又无法建立服务器端重定向的网站,就会出现网站间的重复页面。针对类似情况,Google 提出了以下建议:
选择首选域
当网站内出现重复页面时,搜索引擎会通过一定的算法进行判断,选择其中一套页面进行收录,而其他形式的相似页面,则被列入补充材料甚至不收录。在网站间出现重复页面时,搜索引擎也采用类似的方法。虽然搜索引擎已经能比较准确地判断网页的规范化网址,但有时还是会有偏差。因此,当碰到网站间出现重复页面时,站长应首先确定一个首选域。
减少网站内部的相似页面
在开始解决网站间的相似页面问题前,应首先减少网站内部的相似页面。
尽可能地使用301跳转
在处理网站间的重复页面时,尽可能地使用301跳转,这样可以引导网站流量和搜索引擎爬虫到站长选择的首选域。
跨站使用 Canonial 标签
当不能建立301跳转的情况下,建议跨站使用 Canonial 标签。Google 还强调,Canonical 标签只是对搜索引擎的一个暗示而不是完全的指令,Google 会尽力遵循网站设置的 Canonical 标签并进行索引,但其他搜索引擎能够可能会做不同的处理。
Google 还对如何正确地使用 Canonical 标签进行了解答
问:使用 Canonical 标签所指向的页面必须完全一致吗?
Google:页面间并不需要完全一致,相似即可,细小的差别是允许的。(PS:如果页面间的差别较大,可能 Google 就不会遵循网站设置的 Canonical 标签了)
问:由于某些原因,不能准确地将某些页面进行完全的对应,可以将这些页面用 Canonical 页面指向首选域的首页吗?
Google:不行,这样恐怕会引起问题,最好的方法是将相似的页面对应起来。
问:站长可以在不要收录的页面中 meta 标签中加入 noindex 属性吗?
Google:不行,那样的话 Google 的爬虫无法发现该页面中的 Canonical 标签。