算法名称:飓风算法2.0
算法内容:打击恶劣采集行为
发布时间:2018-09-13
原文详情:
为了营造良好的搜索内容生态,保护搜索用户的阅读浏览体验,保障优质内容生产方在百度搜索中的权益,百度将于9月下旬对飓风算法进行升级。请广大站长尽快对照以下说明进行自查整改,清理全部违规采集内容。
飓风算法2.0主要打击以下四类恶劣采集行为:
1.存在大量从其他站点或公众号等内容生产方采集、搬运而来的内容,信息未经整合,排版混乱,文章可读性差,有明显采集痕迹,对用户无任何增益价值。
示例1:
示例2:
2.存在多段文章拼接的内容,文章逻辑性差,无法满足用户需求,阅读体验差。
3.站点内存在大量采集内容,网站自身的内容生产力极差。
4.站点内存在大量与本站主题无关的采集内容,领域专注度差,恶意获取流量。例如:科技网站采集大量娱乐八卦、社会新闻等情况。
飓风算法2.0解读
飓风算法主要包含以下四类恶劣采集行为:
类型1:采集痕迹明显
详细说明:站点存在大量从其他站点或公众号采集、搬运而来的内容,信息未经整合,排版混乱,部分功能缺失或文章可读性差,有明显采集痕迹,用户阅读感受很差。
示例:采集文章内容中存在超链接不可点、功能缺失问题,采集痕迹明显
建议:对于网站发布的内容,需注意文章的排版和布局,不应出现与文章主旨不相关的信息或不可用的功能,干扰用户的浏览。
类型2:内容拼接
详细说明:采集多篇不同文章进行拼接,整体内容未形成完整逻辑,存在阅读不通顺、文章不连贯等问题,无法满足用户需求。
示例:前后内容无关,逻辑不连贯
建议:我们严厉反对利用采集编辑器等工具,随意生产拼接采集内容的行为,请网站多多生产对用户有价值的原创内容。
类型3:站点存在大量采集内容
详细说明:网站内容下多数内容均为采集,网站自身无内容生产力或内容生产能力较差,网站内容质量较低。
建议:我们鼓励站点生产原创内容,如若转载需标明出处。(如:新闻、政策类等标明出处的转载内容,不会被认为是采集内容)
类型4:跨领域采集
详细说明:站点依靠采集大量与本站领域不一致的内容来获取流量的行为。
示例:教育站点发布美食相关内容
建议:我们鼓励站点生产领域内的文章和内容,通过领域专注度获得更多的搜索青睐。不要尝试采集跨领域的内容来获得短期收益,这样会造成领域专注度的降低,从而影响站点在搜索中的表现。
综上,飓风算法2.0旨在保障搜索用户的浏览体验,保护搜索生态的健康发展、对于违规网站,百度搜索会依据问题的恶劣程度有相应的限制搜索展现的处理。
对于第一次违规的站点,改好后解除限制展现的周期为1个月;
对于第二次违规的站点,我们将不予释放。
还没有评论呢,快来抢沙发~