2012年3月27日星期二

Google黑哨

想在互联网上找资料?Google一下!这种曾经令国内网民视为时髦的美好体验正随着Google越来越近的步伐而渐行渐远。

2005年3月26日开始,Google开始大规模清理所谓中文作弊网站,两个月内,波及上千家中文网站。

Google亮“红牌”

“hao123已经解封了,可是我的站还没有被Google收录。”本文截稿前,一位网友仍在QQ上对记者诉苦。所谓“解封”是指hao123.com这个最大的中文网址导航站被Google重新收录了,而hao123被Google在数据库中删除仅是此前几天刚刚发生的事情。

5月中旬的几天里,几乎与hao123同时被Google封掉的还有很多中文网址导航站,但只有hao123很快被Google重新收录,业界人士多认为这是hao123的东家、中文搜索引擎百度向Google提出申诉的结果。hao123以前只是个人网站,2004年被百度公司以上千万元的价格收购,而Google现在已是百度公司的股东之一,握有百度3%的股份。

“对Google来说,hao123应该算是自己人,否则不会这么快就解封。”任职于国内一家搜索引擎公司的某员工告诉记者,在Google从数据库中删除了一家网站的数据后,即使要重新收录,往往也要等上个把月甚至半年,“hao123这次异常的解封速度说明只有一个可能,那就是Google在采用人工干预的手段,而百度与Google的沟通是非常重要的。”

hao123为什么会被Google封掉?搜索引擎业内人士或许能解读出不同的答案,其中较为吸引眼球的一个说法是Google想在正式进入中国内地市场之前,借封锁hao123来打击百度这个在中文搜索领域的最大对手。但Google既是百度的股东之一,而本次受到打击的网址导航站也不只hao123一家,且现在只有hao123很快被解封,如果是Google有意为难hao123,似乎也没有理由继续封锁其他网址导航站。更重要的是,一些了解hao123的朋友告诉记者,在访问hao123的网络流量中,由Google带来的流量非常少,“可能不到1%”,所以,“被Google封掉其实对hao123的影响非常小”。

“或许是因为hao123用了一些SEO的技术”,一位对搜索引擎技术研究颇深的网友告诉记者,“有些恶意SEO的技术可能被Google机器人当成作弊行为,而且网址导航站点在搜索引擎的角度看,本来就是意义不大的流量中转站,被Google当成作弊站点是完全可以理解的。”

hao123并不是最早被Google“干掉”的中文网站。3月26日开始,Google已频频对中文网站亮出红牌,业内人士多认为,国内一些网站日益严重的作弊行为令Google的中文搜索体验不断下降,是最终迫使Google对中文作弊网站进行大规模清理的主要原因。

Google出于维护用户利益的考虑对中文网页内容进行重新评估,这对中国网民来说似乎是好事,因为作弊网站带给用户的往往是较差的体验。但是在这次大规模清理中,Google采取的过于武断的处理方式正在令这家即将进入中国的企业失去用户对它的信任。

5月2日,著名手机行业站点“手机之家”的站长高春辉被网友告知,Google中关于“手机之家”的信息已被删除。高春辉随后在Google中输入“site:imobile.com.cn”查询“手机之家”网站被收录的情况,果然返回结果为零。这说明“手机之家”已经被Google从网页数据库中删除了,而此前在Google中查询“手机”、“手机之家”等关键词,高春辉的imobile.com.cn始终是排在最前面的网站。这次突然被Google“红牌”罚下,令高春辉和“手机之家”的用户十分不解。

与hao123等提供单一导航服务的网址站不同,“手机之家”是国内最大的五家手机类站点之一,是有着丰富内容及广泛用户群的行业站点。高春辉认为,Google打击作弊网站的举措是可以理解的,但是“手机之家”并未有过针对搜索引擎的作弊行为,所以觉得有点儿冤。

由于Google带来的流量在“手机之家”的总流量中并不占很大比例,所以高春辉开始还并不在意,只是给Google发邮件进行申诉。但“五一”长假过后,很多网民上网时在Google中查找“手机之家”,返回的结果却是其他手机类网站,本来要找‘手机之家’的网友就这样跑到其他网站上去了。“我通过Google没有找到想去的网站,却到了另一个不相干的网站,这样的体验对用户是好是坏?”一位网友的抱怨指出了问题的关键。

像“手机之家”这样被冤杀的网站在这次Google的清查行动中并不鲜见,深圳一位网友苦心经营了数年的网站“驽兽下载(swzn.com)”也吃了Google的红牌,该网站主要提供常用的软件下载,其内容符合国内互联网用户的习惯。在被Google数据库删除之前,在Google上查找几个常用软件(如网际快车、网络蚂蚁、魔法兔子等)的搜索结果,“驽兽下载”都排在前三位,这是由于国内几家最大的网址站如hao123.com、265.com等都收录了该站点上的软件链接,是经多年积累产生的结果。该网站站长认为自己没有作弊,但同样无法联系到Google,便通过媒体向Google发出了一封公开信,直到记者截稿时,Google仍没有给出合理的答复,甚至根本没有人出面来给个说法。

SEO与作弊

Google这次封站的理由是“作弊”,网站作弊背离了搜索引擎

对搜索结果排序的初衷——向用户提供有价值的链接,破坏了正常的搜索结果,严重影响搜索引擎的质量和声誉,甚至会暴露出搜索引擎技术的漏洞,因此作弊行为被搜索引擎厂商深恶痛绝。一个网站一旦被视为作弊,一定会被搜索引擎加以不同程度的处罚,一般会被降低其在搜索结果中的权重甚至完全在搜索引擎的数据库中删除。但是一般来说,不同的搜索引擎对于“作弊”行为会有不同的理解。

Google是如何理解“作弊”行为的呢?在Google的网站上,记者看到了对网站管理员的提醒:“请不要为了提高搜索引擎排名而弄虚作假”,Google还提倡“网页应面向用户,而不是面向搜索引擎。对用户应保持诚实无欺的态度,提交给搜索引擎的内容应与显示给用户的内容一致”。

如果以这些标准来看,无论“手机之家”还是“驽兽下载”,都不能简单地被归入所谓的“作弊”网站,因为这些网站提供的都是用户所需要的内容,它们提交给Google的内容与显示给用户的内容也都是一致的。

不过,在Google认定的“作弊”与“正常”网页之间,还有一类网页是很令Google头疼的,那就是所谓的被“优化”过的网页,也就是业内人士所指的被SEO过的页面,下面是Google在其网站上对SEO的相关叙述:

“SEO是”搜索引擎优化服务商“的缩写。许多SEO为网站所有者提供了诸多有用的服务,包括撰写稿件、为网站结构出谋划策以及帮助查找网站可以提交到的相关目录等。但是,也有少数不道德的SEO采用极为过分的市场营销手段,并试图暗箱操纵搜索引擎结果,从而损害了这个行业的声誉。

Google与任何SEO都没有关联,也不会为您提供这方面的建议,但我们提供了一些提示,帮助您区分哪些SEO可以能改善您的网站,哪些却只能徒使搜索引擎将您从搜索结果中删除。“

Google认可那些可以提升网站质量的SEO,但对于“少数不道德的SEO”则会采取一定的惩罚手段,而到底什么是“不道德的SEO”,Google只是在其网站上给出了几种较为明显的作弊手段。记者采访了曾专门为网站提供搜索引擎营销咨询服务的胡宝介女士,作为SEO专家,胡女士为记者列出了11种可能被搜索引擎(不只是Google)视为“作弊”的情况:

1、堆叠关键词:

为了增加关键词的出现频次,故意在网页代码中,如在META、Title、注释、图片ALT以及URL地址等地方重复书写某关键词。

2、虚假关键词:

通过在META中设置与网站内容无关的关键词,如在Title中设置一些热门的关键词,以达到误导用户进入网站的目的,同样也包括链接关键词与实际内容不符的情况。

3、隐形文本/链接:

为了增加关键词的出现频率,故意在网页中放置一段与背景颜色相同、包含密集关键字的文本。访客看不到,搜索引擎(蜘蛛程序)却能找到。类似的方法还包括超小号文字、文字隐藏层等手段。隐形链接是在隐形文本的基础上在其他页面添加指向目标优化页的行为。

4、重定向(Re-Direct):

使用刷新标记(Meta Refresh)、CGI程序、Java、Javascript或其他技术,当用户进入该页时,迅速自动跳转到另一个网页。重定向使搜索引擎与用户访问到不同的网页。

5、偷换网页:

也称“诱饵行为(Bait&Switch)”,是在一个网页成功注册并获得较好排名后,用另一个无关的网页来替换它的行为。

6、复制站点或内容:

通过复制整个网站或部分网页内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引的行为,网站镜像算是此中的典型。

7、桥页(Doorway):

针对某一关键词专门制作一个优化的页面,链接指向或重定向到目标页面。有时候为动态页面建立静态入口,或为不同的关键词建立不同内页也会用到类似的方法,但与桥页不同的是,前者是网站实际内容所需而建立的,是访问者所需要的,而桥页本身无实际内容,只针对搜索引擎作了一堆充斥了关键词的链接而已。

8、隐形页面(Cloaked Page):

指同一网址下对不同的访问者选择性返回不同的页面内容。搜索引擎得到了高度优化的网页内容,而用户则看到不同的内容。

9、重复注册:

违反网站提交规则,突破时间间隔限制,将一个网页在短时间内反复提交给同一个搜索引擎以获得多次收录的效果。这种情况主要针对其他搜索引擎,Google声称没有对网站提交设立过于严格的规则。

10、垃圾链接:

又叫“链接工厂”,指由大量网页交叉链接构成的一个网络系统。一个站点加入链接工厂后,一方面它可以得到来自该系统内所有网页的链接,同时作为交换,它也奉献出自己的链接。而该系统内的网页都将提升链接得分。

11、包含指向作弊网页的链接:

这种情况下,有的是无辜被作弊网页牵连,有的则是桥页。

有网友认为,上述的最后一种情况被直接视为“作弊”其实是不太合理的,因为一个网站的管理员很难判断其链接到的其他网站是否有“作弊”的情况,在这种“连坐”机制下,被Google“冤杀”的几率大大增加了。

网站托管服务商51.net就是因为类似的“连坐”机制被Google的数据库清除了。51.net上有很多类似abc.51.net的二级域名,这些域名下的网站其实是每个注册用户独立运营的,51.net只是网站空间及域名服务的提供商。但部分51.net的用户在网站建设过程中有意或无意地使用了Google认为是“作弊”的技术手段,Google就把51.net的全部网页都从检索数据库中删除了,这种武断的裁定结果导致51.net旗下很多优秀的子网站都遭了殃。

规则漏洞下的黑哨

如果Google针对中文网站的封杀作弊行动是在一种可预期的有序机制下进行,站长们

或许还能接受,但这次Google封站的结果始终让人看不懂。胡宝介告诉记者,她以前曾对一个小网站进行过简单的优化,使用的是Google认可的一些SEO方法,这个在胡看来无论如何都不可能被列入“作弊”名单的网站居然也在5月19日被Google删掉了,而SEO界一些著名的作弊很厉害的网站,居然有很多至今无事。

“错杀至少一千,放过不止一个。”这是一位网友对Google此次封站的评价,很多人认为Google这次针对中文作弊网站的封杀行动似乎与其一向遵循的“客观公正”的算法选择机制相违背。“Google以其复杂而全自动的搜索方法排除了任何人为因素对搜索结果的影响”,Google在网站上标榜的“客观公正”原则来源于其对自身搜索算法的高度自信,但现在人们开始怀疑Google已经在使用非技术手段来对付网站作弊情况。

“大概是因为我们在‘手机’这个词上的时间太久了,Google都有点儿看得不耐烦了吧。”高春辉在接受记者采访时还不忘了自我解嘲,但一位SEO专家认为,Google左侧排名的关键词并不像百度等其他搜索引擎那样被出售,仍然是以搜索引擎算法作为惟一的排名依据,所以页面布局已近两年没改动的“手机之家”突然被删除,很可能是由于有了人工操作的因素。

如果是由于技术因素导致,人们却没看到近期的Google有非常大的算法改变,很多比“手机之家”优化得厉害的网站也没有被封,所以这次被封是人为因素的可能性非常大,考虑到hao123的被封与解封的过程,SEO界终于认识到Google已经把曾长期恪守的“客观公正”的信条扔在脑后了。

在“驽兽下载”的站长托人写给Google的公开信中也提到:“现在每天依然还有GoogleBot(google搜索机器人)到swzn.com的网站来抓取页面,但该网站却在Google用户的视线中完全消失了。”这种情况也是典型的被手工删除的表现,一位研究搜索引擎的技术人员告诉记者,如果一个网站是被Google的算法判定为作弊,那么Google的搜索机器人应该在短期内不会再爬到这个网站上。

Google为什么要采用人为干预的办法来封站呢?一位搜索引擎技术专家认为,Google今天面临的挑战越来越多,其采用的搜索引擎算法始终没有革命性的创新出现,在SEO盛行的中国互联网上,Google的技术已经不可能侦测出所有作弊网站,“机器无法解决的问题,自然还是交给人来处理比较省事。”

Google就像球场上老迈的力不从心的裁判,场上的球员球技越来越高,速度越来越快,这位裁判追不上也看不清,只好吹黑哨。哨音响过,场上战局自然会有变化,但既然吹的是黑哨,结果只会对原有的脆弱的比赛规则造成更大的伤害。一位网友认为,Google希望站长们的行为更加规范化的初衷是好的,但Google自己首先也应该有比较规范的做事方法,吹黑哨终究不是很光彩的事,而且这次的哨音现在看来并未让任何一方受益。

链接:

如何判断网站被Google视为“作弊”:

1、通过Google工具条查看网站的PageRank值,如果一个网页的PageRank曾经很高,而近期突然降为0,则说明该网站有可能被Google删除了。当然,并非所有PR值为0的网页都被Google删除了,但是被Goolge删除的网站的PR值一定是0。

2、如果网站在google的外部链接数降为0,则说明通向该网站的链接在Google里可能被清空了。在Google工具栏上的Backlinks值可以显示一个网站外部链接的数量,或者可以直接在Google搜索框内键入“link:www.yoursite.com”来显示外部链接的结果。

3、若怀疑网站被Google彻底删除,可在Google搜索框内键入“site:www.yoursite.com”,其返回结果若为空,则说明yoursite.com这个网站根本就没有被Google收录,这是Google最严厉的处罚措施。

《计算机世界》记者 王翌

没有评论:

发表评论