网络视界:Google 搜到头了吗?

      IT业界 2005-1-21 17:26
网络视界:Google 搜到头了吗?
互联网周刊  2003年07月28日  张路

  互联网的神话之一:在互联网上你是主宰者。依据:注意力经济,你的眼球转到哪,广告也就跟到哪。互联网的神话之二:在互联网上没人知道你是一条狗。依据:网络是匿名的。互联网的神话之三:你Google一下,就能搜到你想要找的东西;依据:Google就是好。

  实际上,用Google搜索已经成了一种依赖行为。如果没有Google,你甚至不知道下一个该去的地方是哪。在网民心目中,Google已经等同于Email一样的工具;在技术狂热者的眼中,Google是一个Kill Application(杀手级应用程序)。

  然而Google是家公司,而且是一家快要上市的公司。Google达到了搜索技术的商业化应用的颠峰,但是并不意味着搜索技术就到头了。Google的神话也在开始剥落,人们开始理性的看待Google。

  德国之声7月16日的一篇文章,引用了德国贝塔斯曼基金会的一份最新调研报告。它指出,搜索引擎Google已经完全具备了垄断搜索市场的能力,网上搜索已经“古格尔(Google)化”。其实对于网民来说,这都是无所谓的,谁好我就用谁。逮得住耗子的就是好猫。但是,Google真的能逮住耗子吗?

  调研报告显示,69%的人优先使用Google,39%的人会使用第二个搜索引擎,但几乎没有人使用三个以上搜索引擎。这造成了搜索引擎的高度集中和垄断。另一方面,各搜索引擎对搜索结果进行“人为干涉”的现象已经日趋严重,有些方面今天早已不是秘密:Google对搜索结果进行手工调整,谁花钱,谁就能占有好位置。

  Google依据的“PageRank”算法的标准是:有多少网页与这个网页有链接。结果造成被链接越多的网页在搜索结果中的位置越靠前。这也增加了网上空间的进一步商业化。许多学术方面的、教育方面的网页被挤到了几乎找不到的位置,而孩子们上网搜索经常会出乎意料地面对大量不应该让他们看的网页。调研报告认为,互联网的“古格尔化”也意味着一种潜移默化的愚民化。

  网络空间里的网页数量是一个动态增长的实体。而搜索引擎只是一个利用某种算法抓取网页的工具。据统计,各个搜索引擎抓到的结果,仅是一个集合里的交集,有许多重复,也有许多差异。而且致命的是,它们的全部数量,也只占这个集合的40%。这就是说,有更多的网页是信息世界的孤岛,你无法搜到它们。

  但是Google却在走向世界上最大的信息库的拥有者和垄断者。目前Google已经拥有了3,083,324,652张网页(快照),它收购了deja,一举拥有了20多年来新闻组(USENET)上所有的文本;正在发展的news.google.com则力图以最快速度积聚新闻;以 Blog形式出现的个人发布的文本,也以其价值和可读性成为Google的目标,2月份Google已经收购了全球最大的Blog服务之一 Blogger.com 的提供商Pyra Lab,似乎Google真要成为互联网无所不知的上帝了。

  Google是一个中心概念的应用,它需要把用户圈定在自己的“域”里。为此,它不惜血本用几千台Linux服务器做成集群,使你的搜索结果能够在一个令你满意的时间点出现。但是如果Google被意外屏蔽掉,你就无法再用它了。这和Email有着本质的区别:Email是一种分布式的应用,如果Email的路径上坏了几台服务器,丝毫不影响它从此岸到彼岸的路程。

  中心式应用往往会演变成一场谁也说不清的闹剧,如同域名服务。这种应用不符合互联网的本质:互联网在核战争中也不能被摧毁,IP应该有多条路径可以路由通过。但是它又恰恰符合商业的本质,只有在人流和信息流汇聚的地方,才能产生利润。互联网就是在这种技术和商业的矛盾体中生存。

  分布式搜索也开始成为人们关注的热点。网上唱片业对基于P2P的搜索的围攻,也从反面证实了分布式搜索的力量:你可以搜到并分享别人机器里的 MP3。但是分布式也必须一分为二,比如Napster,就不是完全的分布式,它还保留了一个中心的目录索引。这个中心成为利润的来源,又成了它被攻击的靶子。商业和法律的力量可以很轻易的让中心消解。

  文件的分布式搜索也已经走向前台。它甚至可以垂直搜索到所有共享用户硬盘上的文件、目录乃至整个硬盘。此外,还要大量的声音、视频等多媒体介质需要方便的被搜索。当可以被搜索的东西不断增长时,Google无所不知的品牌力量也在不断增长,或者这些都是它的下一个考虑收购的目标?

  现在已经有人建议将Google变为一个中立性的非盈利性机构,这无疑是开始惧怕Google的潜能了。如果有一天Google控制了你想要看的东西,和你看不到的东西时,你还能去哪里搜索?
标签集:TAGS:
回复Comments() 点击Count()

回复Comments

{commentauthor}
{commentauthor}
{commenttime}
{commentnum}
{commentcontent}
作者:
{commentrecontent}