规范化是选择内容的代表性URL的过程。因此,规范URL是Google从一组重复页面中选择的最具代表性的页面的URL。这一过程通常被称为重复数据消除,它帮助谷歌在搜索结果中只显示一个版本的重复内容。
网站可能有重复内容的原因有很多:
地区变体:例如,美国和英国的一段内容,可以从不同的URL访问,但本质上是相同语言的相同内容
设备变体:例如,同时具有移动和桌面版本的页面
协议变体:例如,站点的HTTP和HTTPS版本
站点功能:例如,分类页面的排序和过滤功能的结果
意外的变体:例如,该站点的演示版本意外地留给爬虫访问
网站上的一些重复内容是正常的,这并不违反谷歌的垃圾邮件政策。然而,通过许多不同的URL访问相同的内容可能是一种糟糕的用户体验,这可能会使您更难跟踪内容在搜索结果中的表现。
Google如何索引和选择规范URL
当谷歌为一个页面编制索引时,它会确定每个页面的主要内容(或中心内容)。如果谷歌发现多个页面似乎相同或主要内容非常相似,它会根据索引过程收集的因素(或信号)选择客观上最完整、对搜索用户最有用的页面,并将其标记为规范。规范页面将被最定期地爬网;为了减少站点上的爬网负载,重复项的爬网频率较低。
有几个因素在规范化中起作用:页面是通过HTTP还是HTTPS提供的、重定向、站点地图中URL的存在以及rel=“规范”链接注释。您可以使用这些技术表示您对Google的偏好,但出于各种原因,Google可能会选择与您不同的页面作为规范页面。也就是说,指示规范偏好是一种提示,而不是规则。
只有当主要内容使用相同语言时,单个页面的不同语言版本才被视为重复(即,如果仅翻译了页眉、页脚和其他非关键文本,但正文保持不变,则页面被视为副本)。要了解有关设置本地化网站的更多信息,请参阅我们关于管理多语言和多区域网站的文档。
谷歌使用规范页面作为评估内容和质量的主要来源。Google搜索结果通常指向规范页面,除非其中一个重复页面明显更适合搜索用户。例如,如果用户在移动设备上,即使桌面页面被标记为规范,搜索结果也可能指向移动页面。
阅读有关如何指示您对规范URL的偏好以及是否需要的更多信息。
还没有评论呢,快来抢沙发~