返回上一页  首页 | cnbeta报时: 15:59:54
''天极下载''罗生门
发布日期:2006-09-08 20:53:44  稿源:
感谢匿名投递:
关于天极的指责,有人写了篇文章,从技术角度说明搜索引擎的原理和事情真相,观点独特,从另一个角度说出了现在许多人攻击百度的真相所在.
每个人都看到了一些东西,然而又都掩盖了一些东西。喧嚣吵闹中,
看客们津津乐道于互联网龙头企业与一个没落的IT资讯网站的肉搏
推搡,而真相到底如何,却少有人去关注了。

搜索引擎知识普及:网页在搜索引擎中的权值计算规则

在Google出来以前,搜索引擎只按照内容进行权值计算。其衡量标
准,大约就是关键词的位置、密度等要素。Google则扛起了Pagerank
的大旗,把网页之间的互相链接,当作权值计算的一个重要因素。

网页的链接,最根本的有两个要素,一个是数量,一个是链接描述。
数量越多,当然这个网页的权威性就越高,越可信赖;而链接描述,
则相当于是外人对该网页的一个内容概括,而且由于不受站长的约
束,而受到搜索引擎的信赖。

在互联网的早期,Google的这种算法效果非常好。因为大家都很纯
洁,几乎没人滥用超链接。但是,很快的,这种策略便开始被人钻
空子。SEO这个行当,应运而生。Link Farm就是早期对超链算法的
一个挑战。而恶搞天才们也开始利用这个策略搞出一些为普通网络
用户广为传播的游戏。比较有名的就是“the failure”:

在Google搜 the failure

第一个结果是:

Biography of President George W. Bush
Biography of the 43rd President of the United States.
www.whitehouse.gov/president/gwbbio.html - 19k - 网页快照 - 类似网页

如果直接按手气不错,也是这个结果。手气不错,是对某些排序第一
的确切结果的提炼。

乔治布什贵为美国总统,当然不是the failure。该页面上也丝毫没有
failure的字样。但是,恶搞者为该页面制造了大量外链,并且链接描
述都是“the failure”,于是,搜索引擎就认为,乔治布什就是失败者。

促成这样的结果,有两个要素:

1,超链算法固有的缺陷
2,对超链算法缺陷的利用

天极下载罗生门解析

我在把话头回到“天极下载”事件。事情起因很简单,在百度搜索“天
极下载”,排第二的是天空网的一个软件下载页面。

天极网,这个一直期望能到纳斯达克上市、对流量的敏感度高于一
切的IT门户,对此耿耿于怀,认为百度在故意的把天极下载的流量,
导到百度所属的天空网上。

这从逻辑上是件很搞笑的事情。

只要会上网的人,都知道天空网的下载,和天极网的下载,两者是
什么样的级别差异。到处都有天空网的盗链站,但有天极网的盗链
站么?哪怕真要盗,也会盗华军,干嘛盗一个名不见经传的小卒子?

这个冷笑话,很快就被人揭穿了底细。

有人发现,天空网的这个软件下载页面,大部分的外链,其描述就是
“天极下载频道”;然后再追溯一下,又惊奇的发现,这些错误的制造
者,居然就是天极网自己。

这是怎么回事呢?让我们追溯一下。

原来,早在2004年的时候,天极网还没有下载频道。但是,播报软
件新闻,能提供下载是最好的。于是天极网就利用了天空网的下载。
但问题在于,明明是天空网的软件下载,天极网偏偏用了“天极下载
频道”这样的链接描述。

天空网是天极网的一个下载频道,这是2004年时候的一个事情。我
不知道这个事情是否有过协议签署。但我估计没有。因为2004年的
天空网还很土瘪,2004年的天极网还很牛逼。一个牛逼的网站,大
笔一挥,把一个土瘪的网站变成自己的频道,这是一种仁慈的恩赐,
而不是一种卑劣的强盗行径。

时光如水,一晃过去了两年多。互联网形势发生了变化。土瘪的天
空网忽然变得很吃香,而牛逼的天极网,则嚷嚷了多少年,仍然距
离纳斯达克十万八千里。

流量,流量,流量!!

当没有更好的人才,作出更好的内容,以吸引更多的用户的时候,
搜索引擎带来的流量,就变成了网站成败的关键。看下hot.yesky.com
的首页,就知道天极对于流量的渴望,达到了什么程度。这些裸体
女郎,强奸新闻,和IT有关系么?这个要问李志高。

天极渴望流量,站长们也渴望流量。于是,天极网上那些IT新闻,
也被站长们一遍又一遍的搬到自己的小站上。

问题就这样发生了。

2004年,那个小编写下的指向天空网的“天极下载频道”,被广大站
长搬运工朋友放大n倍,于是一个不幸的事情发生了:

搜“天极下载”,出来了天空网的一个软件页面;正如搜索the failure,
乔治布什同志被排在Google的第一位一样。

这就是这个“天极下载”故事的本原。

天极网向用户隐瞒了是他们自己把天空网称作“天极下载频道”的一个事实。
站长们向用户隐瞒了搬运天极网新闻页当作自己内容的一个事实。
百度也没有说明过,搜索引擎超链算法中的固有缺陷。

有人要问,明明是天空网的下载页面,为什么百度搜索结果中的
标题,被改成了“天极下载频道”呢?

这个页面因何而被排上来?是因为大量链接描述是“天极下载频道”。
既然如此,把这个内容抬出来,直接展现给用户,不是更直接?

搜索结果的摘要,从来就不是固定为网页内容的片断截取。在Google
中搜新浪,其摘要也非来自新浪首页。策略是次要的,让用户更容
易的把握页面内容,这是真谛。

这种摘要策略,在一般情况下是有效的;但是,在这种人为的、对
信息肆意扭曲的前提下,策略失败了。这也是百度应该反思的。

罗生门背后的故事

事情本来不复杂,天极没人懂搜索引擎,他们尽可以派个人到百度
去请教一下。但是,天极似乎一开始就来势汹汹,并不以解决问题
达成谅解为初衷。

原因何在?

百度有钱。
百度是棵大树。
百度是中文互联网新贵。

靠着大树好乘凉。谁也不能否认,只要一和百度产生纠纷,你立刻
就能一举成名。没落的IT贵族既然没有堂皇的生财之道,阿Q似的
“我被赵太爷踢了一脚”便也是一种选择。

成长无望,上市渺茫,砸点人气总还是可以的。好容易逮到一个啃百
度的机会,谁也不会放弃。更何况,在中国的几大互联网企业中,
除了百度,谁都不好啃。百度这个苹果,嫩,且多汁。小D啃得,我
阿Q就啃不得?

而且,天空网、华军网、太平洋下载站,似乎都混得不错,mydown.com
作为天极网的属下网站,没有理由混不好。借这个机会,扬名立万,
alexa上波涛汹涌,岂不快哉。

所以,我大胆的猜测,好戏,还有得看。中国的互联网,从来就很少
有人踏踏实实的做事情,而唱戏做秀则司空见惯。作为观众的一员,
我唯一的期望就是,戏,可以唱,但尽量唱得精彩些。我最近胃口不
好,呕吐多了,怕伤脾胃。

天极下载罗生门事件,我就讲述到此。

查看:“天极下载”罗生门
我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看网友评论   返回完整版观看

返回上一页  首页 | cnbeta报时: 15:59:54

文字版  标准版  电脑端

© 2003-2025