【张亚楠】最近百度推出飓风算法,严厉打击恶劣采集站,很多站点不幸中招,流量一夜回到解放前。我研究了百度和Google的文档,详细定位了算法的命中范围。
百度公告
我们先来看下百度官方公告,内容如下:
飓风算法分析
从官方文档中来看,飓风算法的命中对象是站点,而不是网页;主要是针对以恶劣采集为内容主要来源的网站,而不是所有包含恶劣内容的站点。
哪些内容算是恶劣采集
恶劣采集内容,一般是指没有花费时间,精力,专业能力,人工整合的内容,或者说对用户没有任何附加价值的内容。
这部分内容有以下几种类型:
注意几个要点:主体内容、恶劣采集、附加价值。
哪些内容不算是恶劣采集
群里也有朋友问,为什么有些网站也是采集的,但没有受到影响,比如某doc、某浪。其实只要做到某个要点,就不算是恶劣采集,这个要点就是:给用户带来附加价值。
附加价值有站点增益和内容增益两种。这个时候可以引用百度搜索技术博客《浅谈互联网页面价值》的一段内容:
这里的要点是:页面价值、增益
因此说,只要能够带来站点增益,内容增益,给用户带来附加价值,那就表明这个网页有其独特的价值,是不会被飓风算法命中的。
最后
百度的朋友透露,飓风算法主要是针对没有价值的采集,一旦中招没有任何解法。而被误伤的优质原创可以通过反馈中心申诉。如何避免被飓风算法命中。(我下一篇文章会讲。)
百度最近的战略发生了调整,对内容生态的打造成了重中之重。而对恶劣采集内容的打击,也是势在必行。
我预测,对采集的打击,对原创的支持,将是百度搜索内容部分的主旋律,飓风算法也会持续更新。
下一篇将揭秘如何避免被飓风算法命中,敬请期待。
———————————–【百度飓风来袭】网站被百度飓风算法处罚怎么办——————————-
前言
在百度站长论坛,看到有很多朋友提问,网站中了百度飓风算法,被飓风“吹成太监”,该怎么办好。在上一篇文章分析了飓风算法的命中范围。这次我们来谈谈解决方法。
被飓风算法影响怎么办
针对飓风算法的影响,百度一个朋友透露说:
飓风算法主要是针对没有价值的采集,一旦中招没有任何解法。而被误伤的优质原创可以通过反馈中心申诉。
因此,一旦被飓风算法命中,只要不是明显误伤,短期内都没有办法解决。(被搜素引擎算法命中,一般都是普遍存在的,不被搜素引擎接受的做法,一般没办法申诉,Google也是如此。只有人工处理的能申诉。)
如何避免被飓风算法命中
采集会被算法惩罚,而内容完全原创,成本又非常高。那如何生成内容,而又不被飓风算法惩罚呢。其实还是围绕内容增益上去解决,有几个解决方法:
增加用户点评模块
页面增加用户点评模块,当有用户点评之后,点评内容也会成为网页内容的一部分,产生了额外价值。作为用户,在阅读完内容之后,也希望看一下真实用户的意见,比如这个内容是否属实,信息是否失效,有没有额外的提醒等。
不过要注意的是,点评内容最好是在源码中实现,而不是在JS中(方便搜素引擎识别)。
增加内容推荐模块
根据网页主题,添加相关的内容模块,比如延伸阅读,之前报道,相关阅读等。作为用户,可以更加详细完整的了解事件的发展,比如关于“张艺兴”的一篇新闻,可以了解他之前参加过什么活动,有什么绯闻,参与的极限挑战的进展情况等。这些对用户来讲,都是非常有价值的。
内容整合
根据主题,将多篇内容整合为一篇。跟之前内容相比,整合后的内容更加丰富,可以满足用户更多需求。比如一篇“梦见老虎”的内容,如果能够添加“梦见老虎吃人”、“梦见被老虎追”等内容,将会更可能命中用户的梦境。
另一种比较常见的就是专题页,将相关主题的内容全部组织起来,按照重要程度安排内容布局。这种专题页有运营小伙伴编辑的,也有程序生成的(使用开源搜索引擎,比如Lucene,Sphinx,Xapian)。
申请百度原创
如果确实是优质原创内容,还是推荐加入百度原创保护项目。目前这个项目在内侧阶段,需要百度邀请加入。如果对自己的内容非常自信,可以跟我联系,我可能会推荐给院长。
后记
头图来自某网站受算法影响的截图;
随着更新频率提高,感觉内容质量有所下降,需要反思下。
【张亚楠】微信公众号:seo技术流