您好!欢迎进入成都安尚科技有限公司

搜索引擎针对网站优化的反作弊和人工干预规则

来源:未知
时间:2020-03-16
采会把一些用户经常搜索的关键词的搜索结果放入到缓存中,这样当该关键词再次被搜索时,
结,因此速率极快。现在为了加快用户查询的响应速度,缓存几乎成了搜索引擎的标配。搜索 
凯可以直接从内存中调取搜索结果,而不必再从索引库中进行重新检索和排名。缓存机制的引 
次数都非常少,类似于长尾理论。因此搜索引擎把用户经常查询的“少量”关键词的搜索结果
人,不仅加快了搜索引擎对用户搜索的反应速度,也减少了搜索引擎对数据的重复计算。
的读素用户的搜索请求中,少数查询词占了查询总数的相当大比例,而大多数查询词单个出现的
存放于缓存中,就可以应对大多数用户的搜索请求了。整个搜索引黎的缓存机制中还会涉及缓 
存淘汰和缓存更新机制。
把使用频率小的搜索结果刷除,补充进来使用频率大的搜索结果,来保证缓存空间中的内容可
以响应及命中当下尽可能多的用户搜索请求。同时网页和索引库中的文件内容随着时间的变化 
因为搜索引采的缓存也不是无限的,肯定有满载的时候,此时就需要有合理的淘汰机制,
也会有所变动,为了使得缓存中的结果和网页内容同步,此时就需要有合理的缓存更新机制。
新,而是会选择在午夜等搜索请求比较少的时间段进行更新缓存,所以用户在不同时间搜索同
 这里解释一下缓存更新机制:搜索引整为了节省资源,不可能对缓存中的内容进行实时更 
果。现在的搜索引等会分析搜索词的属性,并根据搜索词的属性调整缓存的更新频率,比如,
频率肯定是不同的。需要说明的是,现在大型搜索引擎的缓存都不是简单地直接缓存关键词的
现在百度的“最新相关信息”“最新相关微博”等实时性搜索的缓存更新频率和普通词缓存更新 
搜索结果,而是拥有很复杂的缓存结构和数据,一般是多级结构的,同时提升搜索引擎的响应
速度和缓存数据的命中搜索范围。
一个关键词得到的结果可能是不同的,但是一般在较短时间内的重复搜索会得到相同的搜索结
频率肯定是不同的。需要说明的是,现在大型搜索引擎的缓存都不是简单地直接缓存关键词的
 这里要特别注意一下“有效索引”和“缓存”这两个模块,站长和SEO人员所留意到的很
 多问题其实都可以在这两个模块的原理中找到答案。在第3章快照、site 命令等基础内容介绍部 
分会进行详细讨论。
(2. 9 反作弊和人工干预 
自从有搜索引擎以来,就有人不断研究搜索引擎的排名机制,进而寻找搜索引擎排名的技
 术和逻辑漏洞,来快速提升自己网站的搜索排名,并且获得流量和收益。也就是说自从有搜
 索引擎以来,作弊就没有停止过。为了保证呈现给用户的搜索结果质量,发掘真正内容优质、
 用户体验最佳的网页,反作弊一直都是搜索引擎研究的重要课题,但是搜索引擎一直处于被
 动的应对地位,经常是发现搜索结果被作弊网页攻陷了,才去研究相应的反作弊对策和算法
 那么搜索引擎在反作弊的过程中主要是如何操作的呢?真的会像外界猜测的那样有那么多的)
工干预吗?
您可请河,
 索引擎以来,作弊就没有停止过。为了保证呈现给用户的搜索结果质量,发掘真正内容优质、
 用户体验最佳的网页,反作弊一直都是搜索引擎研究的重要课题,但是搜索引擎一直处于被
 动的应对地位,经常是发现搜索结果被作弊网页攻陷了,才去研究相应的反作弊对策和算法
 那么搜索引擎在反作弊的过程中主要是如何操作的呢?真的会像外界猜测的那样有那么多的)
工干预吗?
2. 9. 1 反作弊算法
在搜索引擎的架构中过滤也是很重要的一环,在Spider 抓取部分会过滤掉重复和垃圾页
在进行排序和呈现时同样还会进行一次过滤,来保证搜索结果的质量。反作弊就是过滤环节
的主要组成部分。当下搜索引等排名的重要参考因素主要有内容、链接、网站权重和用户体验,
所以作弊也一般是从这几方面入手。第12章会详细讨论一下常见的作弊手法,这里主要来讨论
一下搜索引擎是如何进行反作弊的,反作弊过程中是否会出现误伤,以及站长和SEO人员应该 
H
如何避免被搜索引擎误伤。
虽然搜索引擎针对每种作弊行为所做的反作弊动作和算法各不相同,但是大体上还是有一
定规律可循的。搜索引擎会利用黑白名单和作弊特征研究两方面进行反作弊算法升级。
m
定规律可循的。搜索引擎会利用黑白名单和作弊特征研究两方面进行反作弊算法升级。
1. 黑白名单
搜索引擎会根据网站内容的质量、权重和品牌建立白名单,也会找出明显作弊严重的网站
建立黑名单。搜索引擎会认为白名单中网站所推荐的网站都是好的、健康的网站,含有黑名单
中网站链接的网站可能会存在某种问题。
如图2-24所示,链向白名单网站中的网站不一定是健康的,同时黑名单网站中链向的网站 
 也不一定是不健康的。但是有多个白名单网站链向同一个网站,那么这个网站就很可能是健康 
的;同一个网站链向了多个黑名单中的网站,就可以把其认定为不健康的网站。
在整个互联网中,黑白名单中的网站不可能和名单外的网站都有直接链接关系,所以搜索
引擎会给这种白名单的链接一定的信任值,这个信任值随着链接级数的增加而逐级衰减:同样
从黑名单网站反向开始,会给最终链接指向黑名单网站的各级链接一个不信任值,这个值也是
 逐级递减的。对于一个黑白名单之外且和黑白名单中网站没有直接联系的网站,搜索引擎会计
算它得到的信任值和不信任值,当达到或超过搜索引擎设置的阀值之后,就会把其列为健康区
站或者不健康网站。
这是一种很常见的反作弊方式,在SEO工作中体现最明显的就是选择服务器和交换友情
接。选择服务器时,大家都希望自己独立使用一台服务器或者一个 IP:选择虚拟空间时,也
检查相同 IP 的网站是否有作弊嫌疑,以免被相同 IP 网站连累。虽然百度官方声明不会按照 
惩罚网站,但还是远离作弊网站比较稳妥。交换友情链接时就更明显了,一般都会检查对方
无作弊嫌疑或降权嫌疑,以免自己把链接指向不健康的网站而遭到搜索引擎的惩罚。 
2. 作弊特征研究 
作弊特征研究是现在搜索引整进行反作弊的主要手法。当发现一个对搜索结果影的 
作弊网站或一种新的作擎手法时,一般不会只是人工地把这个或赵量网站降权或者屏款 
潜心研究这个网站或这些网站到底是怎么作弊的,以及钻了搜索引学授术和造辑上的什么
年所发布的算法升级都是有针对性的,不是针对操纵PR的链接作弊,就是针对网站影响的方
 行为。这都是研究作弊手法的特征后进行有针对性的算法升级的。 
因为是针对某一特征的反作弊算法升级,也有可能会出现这种情况;某个网站没有件。
当发现漏洞后就会提升算法弥补漏洞,同时对这种作弊方法进行有针对性的打击。Goop.. 
验行为的作弊等。百度更是如此,从2012年6月份以来的算法开级,每次都会针对特定的
但是也有类似作弊站的某些特征,而被搜索引擎捎带处罚了一下,视特征的符合程度遭受:
处罚程度不同。也就是说搜索引擎在反作弊的算法升级过程中,很有可能会产生误伤。这
验行为的作弊等。百度更是如此,从2012年6月份以来的算法开级,每次都会针对特定的
 伤会不会产生,以及误伤程度和误伤范围要取决于搜索引擎打击作弊的力度和算法的精度 
比如,百度搜索在2012年10月23日针对超链接作弊的算法升级过程中,只是取消了件。
链接的作用,而因为有很多有着优质内容的综合门户网站也都参与了此种作弊,所以才没有
参与作弊的网站进行打击。这种反作弊算法也就是把作弊的情况整理了一下,作弊站顶多失+
作弊部分所带来的排名和流量,而没有得到其他额外的惩罚,这样没有作弊的网站就更不可修 
得到惩罚了。顶多有几个外链的作用消失而已。
又如,百度搜索在 2012年6月28日针对采集站和垃圾站的算法升级中,因为是识别垃圾
和采集,又因为搜索引擎暂时不能精确地识别原创,所以就导致了一些网站被连累,产生了-
定误伤。后来百度搜索部门对投诉的网站进行了详细分析,虽然只有少数的网站被确定为误伤,
但是可以肯定这种算法升级有一定的负面连锁反应。
站长和SEO人员在工作中,不仅仅要尽心尽力地运营自己的网站,还要避免自己和作弊站、
垃圾站有所靠近或关联,同时要尽可能地向优质高权重网站靠近或扯上关系,相信这也是大部
分站长和SEO人员一直努力的方向。但是很少有朋友有心避免被反作弊算法牵连,搜索引擎 
反作弊稍微严格一点就可能产生误伤,作为站长和SEO人员应该尽可能避免这种被误伤的情 
的算法再精准也是人设计出来的,并不是神造的、完美无暇的,所以有作弊就会有反作弊,
况发生。
地习
站长和SEO人员要潜心研究搜索引擎想要打击的作弊行为的特征。比如,某种作弊行为都 
卖链接的网站一般都会设置隐藏的链接块或文本块,并且卖的链接中经常会有医疗病种、私服、 
会选择使用一套开源CMS 程序或者模版,那么你就要尽可能避免使用同一个CMS和模版;买
赌博或者其他暴利、高竞争的关键词,那么你就要尽可能地不使用隐藏的 TAB 来做友情链接,
并且最好不要和搜索引擎重点打击行业的网站做友情链接等。搜索引擎打击所有的作弊行为中,
就应该避免和这些作弊行为有相似的地方。比如,某个人长相和奥巴马一样可能会受到追择,
在研究站长作弊背后的动机和站在对立角度审视自己的各种算法,一般在算法上线之前都会区 
最后,需要了解的是,针对反作弊,搜索引擎也并不是总处于被动状态。搜索引擎也一 
肯定都会根据这种作弊行为的特征进行算法升级,那么作为一个“负责任的”站长或SEO人页某人长得和“凤姐”一样就可能会受到鄙视或嘲笑。计相关算法,把站长容易操纵的作弊因素根据特征从正常的算法中过滤掉,并不是一味地亡羊 补牢和处罚作弊站点。这应该也是近年来大众认为“SEO越来越难做”的原因之一。
2. 9. 2 人工干预
在反作弊过程中,也很有可能会伴随着人工干预自然搜索排名,但是搜索引擎中的人工干
预肯定不会是大众想象的那样频繁,也不是浅层次上的干预,否则搜索引擎自然排名的算法就
可以丢弃了,搜索引擎也没有那么多专门来干预排名的人。但是不论多么大的搜索引擎,肯定 
都会有人工干预的存在。 
能够让搜索引擎人工干预的站点,肯定是严重背离搜索引擎运作机制,或者严重影响到了 
搜索引擎的搜索结果质量,这种站点一般在搜索引擎上获得了异常多的流量,否则搜索引擎为
众多网站导流量,并不会特别注意到。也就是说很多自认为遭受了人工干预的网站,或许根本
就没有达到被搜索引擎人工干预的资格。在行业内,一般会认为被讨论越多的站越容易 Over. 
虽然正规的网站在SEO上也有很多值得讨论研究的地方,但在业内远不如对于作弊站点的讨论
激烈。当搜索引擎从一些途径获得这些信息后,认为该站点的作弊行为已经产生了非常不良的 
影响,就可能会先进行人工干预,随后研究其作弊方法。
虽然正规的网站在SEO上也有很多值得讨论研究的地方,但在业内远不如对于作弊站点的讨论
激烈。当搜索引擎从一些途径获得这些信息后,认为该站点的作弊行为已经产生了非常不良的 
影响,就可能会先进行人工干预,随后研究其作弊方法。
有很多朋友都在各种站长论坛中发帖声称自己被人工干预了,如图2-25和图2-26分别是在 
百度和Google中搜索“百度人工干预”的结果数量。百度搜索有802000条,Google搜索有993000 
条,这些声称自己被人工干预的站点其实都是小站,还没有达到被人工干预的程度,真正能够 
 逼迫搜索引擎进行人工干预的站一般都是“大佬”或者技术逻辑“高手”的站点,用特殊资源
顶上去的网站,恶意抢夺了太多的流量,而这些“大佬”和偷偷赚钱的“高手”是不会到处发
帖子玩儿的,一个网站被干掉后,一会马上研究其他的项目。当然也有说因为和百度的利益 
 关系遭到人工干预的站点,像我等这种“屁丝级”的人物是接触不到的,所以一般网站被降权 
百度和Google中搜索“百度人工干预”的结果数量。百度搜索有802000条,Google搜索有993000 
条,这些声称自己被人工干预的站点其实都是小站,还没有达到被人工干预的程度,真正能够 
 逼迫搜索引擎进行人工干预的站一般都是“大佬”或者技术逻辑“高手”的站点,用特殊资源
顶上去的网站,恶意抢夺了太多的流量,而这些“大佬”和偷偷赚钱的“高手”是不会到处发
帖子玩儿的,一个网站被干掉后,一会马上研究其他的项目。当然也有说因为和百度的利益 
 关系遭到人工干预的站点,像我等这种“屁丝级”的人物是接触不到的,所以一般网站被降权 
后,基本不用考虑人工干预的事。
百度人工干换
 
百度进行人工干预的情况应该会有以下几种:某站长发现百度算法重大漏洞,使用低质量
 内容抢夺了太多百度搜索流量,已经明显影响到用户的搜索体验;针对热门搜索词或敏感词,
为了“不捅娄子”可能会进行人工干预,搜索结果只使用某些主流网站的内容;针对不满意的
搜索结果进行各项因素的权重比例微调等。
 关于百度人工干预的更多讨论,可以浏览知乎上的帖子“怎么判断一个词的搜索结果在百
度被人工干预,或者网站被处罚了?”,里面有前百度人曹政曹大侠的回复,也有其他不少业内
 
S60深度解析全检桐按索引票优化的核心秘密(第2版)
人要的的复、众设经经,自已体会和辨别网、地址为:http://www. zhinu. com/question/lo
N然和其险注您网站育戈系,盘不持除一种可能性比较小的销况,就是被搜索引擎的后心目
 验是、限多站长和SF0人虽已经不把注养当作弊了、商是把很多作弊行为都当成正规运业
 网站在授实引条中的表理定就下滑,不是自己网站作养被搜索引条处罚了,就是由*
 试牵连了、当发理网站在按索引条中突然表现得很悲能时,就从以上三点找原因吧、不
 比如、有一此850人员居然会发布类议“人家的内容全是高价请人伪原创的,一点作整起知
被降权”的吐措站。
函2. 10 本章小结 
 知己知彼才能百战不验、退然站长和SEO人员没必要一定得了解搜索引擎的详细算法
是搜索引等一般性的架构和逻辑还是要搞清楚的。不论是顺从搜索引擎的游戏规则而在擅。
 鉴中长期生存、还是对抗搜索引菜,寻找搜索引孚技术或逻辑漏洞而获得一时的暴利,搜味
 擎原理都是需要了解和研究的,对搜索引擎原理越熟越精,SEO 工作就越可以高效地进行,
 荐大家研究一下常见的搜索引整程序或架构,现在不少网站的站内搜索会使用 Sphinx 或Luce
有能力的SEO人员可以自行简单搭建及研究一下这两个程序的工作原理,或者直接研究一下
己所负责网站的站内搜索,从而加深对搜索引孚排序工作原理的理解,也会对以后设计和摸
相关的产品大有帮助。
 另外、建议有高数基础的朋友可以深入了解一下搜索引擎在内容主题词提取、链接分析
网页去重、信息归类、相关度判断等领域的常规算法及原理,这样就可以站在更高的角度
 了解搜索引季排名早已不会被简单堆砌关键词和滥发链接所控制了,甚至会感觉原始的SEC
现在网络上有太多不负责任的SEO软文,把很多问题都本末倒置了,当一个SEO人员能够
 受搜索引擎的运作原理以及更好地辅助自己设计高质、合理的 SEO 产品,也会使自己更深/
础方法在当下的搜索引华眼中已经很“小儿科”了,在阅读一些SEO低质软文时也会一笑了
易正确判断出唾些文章是干货,哪些文章是低质软文时,也就了解SEO的真正内涵了。
 
本文由成都程曦科技编辑,转载请注明出处:http://www.cx37.cn/newv/ydhlwv/643.html
  • 标签


您可以在线咨询...

181-4011-7033

400-600-1167

四川成都市武侯区二环路南四段54号莱蒙都会1栋1101

关注有惊喜

2012-2017安尚科技 版权所有 蜀ICP备16008652号

获取同行营销方案,10秒填写,急速获取
今日已有188人获取方案
在线客服
免费咨询热线
028-68765260
181-4011-7033

关注有惊喜