为什么我们选择Gmail和Orkut? 发表于: 04年8月29日 19:16

      技术 2004-8-30 12:32
为什么我们选择Gmail和Orkut? 发表于: 04年8月29日 19:16

--------------------------------------------------------------------------------

原文连接:http://forum.blogchina.com/forum/p1441.html

按:有博友拒绝gmail,"鄙视"爱Gmail的博友,为了说明Gmail和Orkut的伟大之处,特把这篇文章发过来,作为理解Gmail或Orkut的理论纲领。作为一种尝试,没有理由拒绝Gmail或Orkut.儒家说要"以德服人",我们Goolger奉行"以理服人".有了理论指导,才能确定我们的行动的正确性.
希望没有Gmail的博友在目前Gmail邀请大量发送的时机,先获得一个gmail,自己试用后,再决定有了邀请后是否邀请自己的朋友或家人一起使用Gmail.没有任何商业目的,只是觉的好东西应该共享.

欢迎加入Goolger

连结──混沌、复杂之后,最具开创性的「小世界」理论

连结
 书名:连结──混沌、复杂之后,最具开创性的「小世界」理论 作者:布侃南(Mark Buchanan) 译者:胡守仁 预定出版时间:2003年9月 出版公司:天下文化(台北)

一九九八年初的某一天,康乃尔大学的华兹(Duncan Watts)及史楚盖兹(Steve Strogatz)坐在史楚盖兹的办公室里,他们在纸上画了一连串的点,然后把其中某些点以线相连,形成了数学家称之为图(graph)的东西。这听起来似乎不是什幺了不起的数学,当然也不像会搞出什幺发现的好方法。不过,不久后这两个数学家就会知道,他们当初连结这些点的特殊方式,是所有数学家以前不曾想到过的。就这样,他们撞上了一种前所未见、令人极度着迷的图。华兹和史楚盖兹是在企图理解人际关系世界里的一个奇特谜团时,碰到这种图的。在一九六○年代,美国心理学家米尔格兰(Stanley Milgram, 1933-1984)曾经想要描绘一个连结人与社区的人际连系网。他在内布斯加州及堪萨斯州随机选出一些人,寄信给他们,在信中麻烦他们把信转寄给他在波士顿的一位股票经纪人朋友,但是并没有给他们他那位朋友的地址。为了转寄这封信,他请他们只能把信寄给他们认识的某个朋友,而这个收件人是他们认为在人脉上可能比较「接近」那位股票交易员的人。六度分隔大多数的信最后都到了他朋友的手中,而且远远出人意外的是,这些信并没有经过上百次的转寄,而是只转寄了约莫六次。这个结果看来很不可思议,因为美国有几亿人口,而从社交世界看来,内布斯加及堪萨斯两个州距波士顿十分遥远。米尔格兰的发现大大出名了,而且成为广为流传的说法——六度分隔(six degrees of separation)。剧作家贵尔(John Guare)在一出同名的近作中表达了这个概念:「在地球上,每个人与其它人之间都只相隔六个人……美国总统,威尼斯的船夫……不只是那些有名的人,任何人都一样,不管是生活在热带雨林中的土著,南美洲火地岛上的居民,还是爱斯基摩人。我和地球上的每个人,都可以经过六个人而拉上关系。这是个十分深奥的想法……」这想法十分深奥,不过看起来似乎是对的。几年前,一家德国报社接受了一项有趣的挑战,要帮法兰克福的一位土耳其烤肉店老板,找出他和他最喜欢的影星马龙‧白兰度的关连。经过了几个月,《时代周报》(Die Zeit)的员工发现,这两人只经由不超过六个人的私交,就建立了人脉关系。原来烤肉店的老板是伊拉克移民,有个朋友住在加州,刚好这个朋友的同事,是电影「这个男人有点色」的制作人的女儿在女生联谊会的结拜姐妹的男朋友,而马龙‧白兰度主演了这部片子。「六度分隔」是人际关系世界中无可否认而又令人震惊的特征,许多社会学上的细腻研究,也给出令人信服的证据说明这是对的——不只是在特例,也在一般的情形下。但是,这怎幺可能是对的?六十亿人怎幺可能那幺紧密的相互关连着?
这些问题就是华兹和史楚盖兹所要问的。如果你把人看成点,人与人的相识关系看成点与点的联机,那幺人际关系就会成为一个图。就这样,华兹和史楚盖兹花了几个月的时间画着各种图,用不同的模式连结图上的点,意图找出某个出奇的方式,可以弄清楚六十亿人如何这幺紧密连结在一起。他们尝试着把点与联机画成网格,就像棋盘那样排列整齐;他们也试着把点随意连接,形成随机的图,让每个图看起来就像胡乱拼凑的连连看游戏。但不管是整齐的图还是随机的图,似乎都无法掌握真实人际关系网的微妙之处。「小世界」的奥秘仍然悬而未解。
终于,就在一九九八那年一、二月间,这两个研究人员撞上了他们那个特别的图。他们找到了一个巧妙的方式连接那些点,既不完全按照规律也不全然随机,而是在两者中间,是一种规律中交杂着混沌的平衡模式。跟着的几个星期,华兹和史楚盖兹对这个奇特的图玩弄了不同的花样,结果他们发现这个图掌握了重要关键,可以解释六十亿人如何靠着六条联机与别人相连。
网络暗藏了什幺科学?
在本书中,我们将更进一步探索这些「小世界」图,看看这些图如何发挥魔力般的作用。不过,这些迷人的数学结构只是更重要的发现的前奏。由于一心想知道人际网络和其它网络究竟有什幺不同,华兹与史楚盖兹研究了美国电力网及线虫的神经网络;线虫这种生物十分简单,因此在一九八○年代,生物学家就做出了它的整个神经系统的分布图。美国电力网是人设计的,而线虫的神经系统是演化而来的,但是这两种网络竟然和人际网络有着几乎一样的「小世界」结构。不知道是什幺神秘的原因,华兹和史楚盖兹的模样奇特的图,似乎暗示了人类世界中某种深奥的组织原则。
自从华兹和史楚盖兹发表了他们的发现,往后的数年间,其它的数学家、物理学家与计算机科学家,也纷纷投入研究,结果发现,世界上许多其它的网络也都有极相似的结构。他们发现,人际网络和全球信息网(World Wide Web)的架构几乎完全一样;在全球信息网中,网页所形成的网络,以超文件(hypertext)的链接方式相连。所有这些网络,和任何生态系中的食物网,或任何国家经济活动中的商业连结网络,享有相同的结构性质。不可思议的是,这些网络和人类脑神经元的连结网络,以及活细胞内的分子交互作用网络,有着完全相同的组织。
这些发现正在形成一门新的网络科学,而这正是本书的焦点。令人称奇的是,在物质世界及人类世界中运作的,竟是同样的设计原则;因应不同需要、在不同条件下发展出来的网络,其架构竟然几乎完全相同。这是为什幺呢?对于网络的新理论观点,将有助于我们回答这个问题,也将使得几乎所有科学领域的研究人员,得以对付眼前某些最具挑战性的重要问题。

看不见的网络动力   
--------------------------------------------------------------------------------



昨天逛书店时,看到物理学者Mark Buchanan写的《连结》(Nexus)出了中文版,这本书生动活泼地介绍了跨越众多领域的新兴网络科学,其中社会学对经济现象的网络分析占了相当的篇幅,令我兴奋了好一会儿。

身处于数字时代,你我多少都有过在网络上参与虚拟社群,或者利用超文本(hypertext)编织连结的体验,但是对于现实世界中的社会网络反而却不容易体会。其实,网络早已上身,它像万有引力一样,存在于由数以万计的人际关系所构成的无形之网当中,牵动着我们每个微小个体的机会与命运。

我曾在课堂上做过一个小小的实验,想让隐形的网络原形毕露。学期一开始,我要学生们回答底下的问题:假设你有三张你最喜欢歌手的演唱会门票,你会给班上哪些同学?我搜集了学生的答案,把每个学生当成一个点,把每个给票的动作当成一条线,借着一点软件的帮助,很快画出一张由30个点以及连结这些点的线所构成的网络图。

这张图显示出了存在于学生之间、肉眼所无法观察得到的微型关系结构。有一些学生显然颇受欢迎,是许多关爱都流向他的「明星」(或者说,「水槽」)。相反地,也有一群没什么人理睬的「孤儿」。当然,大部分学生的网络处境居于中间。

正因这90条关系线并非平均分布,整张图大致形成被一些空白地带隔开的「小圈圈」。联系起这些小圈圈的,可以是像双面间谍般同时身处两边的「守门人」,或者是一条架在分属不同圈子两点之间的「桥」。如果你被派驻到合作厂商,你可能就会慢慢接近到类似「守门人」的网络位置。如果你在咖啡店,看到一群年轻男女,「一边一国」围坐一桌,生涩地逐一自我介绍,当中那对显然已经熟识并且热心居中串场的男女,八成就是网络的「桥」。

配合授课的需要,我照例要求学生自行每五个人组成一组,学期最后提出分组报告。这次,我请几位助理根据网络图来预测一下学生的分组名单。结果,对照实际的分组,竟然高度吻合,可见得网络牵引排斥的动力确实在发挥作用。

更进一步观察学生的分组,我还发现,那些汇集了较多资源的点,虽然各拥山头(环绕着一群卫星),但是他们之间距离颇近,有的甚至就在同一组里。令我感到惊讶的是,在这个班级里,那些散置各处的「孤儿」竟然也凑合成一组。

到了学期末,我把学生成绩跟他们的网络落点拿来分析,结果发现:越是被完整网络包裹着的学生成绩越好;而那些落单的孤儿,成绩则最不理想。「联盟」果然只是虚有其表。原本平面的网络,一下子浮现了垂直的层级面貌,这也颇能呼应我们在大社会中的观察与感受,不是吗?政商名流似乎总是很容易在各种场合「不期而遇」;而「联合所有被压迫者」的结盟则多半名存实亡。

「因」与「果」常相互循环、不易截然二分;但我从学生的学习经验上,确实可以看出网络本身的作用。网络润滑无碍的小组,学生间的活动频繁而多元(一起搜集资料、相互交换笔记、提醒课程调动、同台轮番报告)。让我这老师不禁狐疑,「考试作弊,也会极有默契吧?」相较之下,一位网络孤儿跟我埋怨他们的小组:老是凑不出聚会时段、课程调动没人提醒、记错笔记也浑然不知。前者的学习经验一路顺畅愉快,资源似乎随手可得;后者则犹如踏入泥沼般举步维艰、挫折无以名状,连发泄的出口好象都找不到。

这些学生都看不到网络的存在,但无疑都受到网络引力的影响。我们如果把此处的老师假想成老板、学生假想成员工、小组假想成部门,小教室里发生的网络动态或许可以使我们联想到公司内部的许多经验。但是,无形之网可以适用到公司之外远为广渺的市场吗?《连结》一书中最被激赏的经济社会学者Granovetter,正是从人们「找工作」的经验出发,才完成他那份开创典范的研究论文。

经济学教科书里想象的市场,宛如每个人都盯着价格看板,伺机进出的股市。求才的信息透过报纸或网站这类公开的正式管道发布给所有的求职者;透过议价,抢人与抢位子的竞争于是牵动了人与位子间最恰当的媒合(matching)。网络原本就不易观察,这种模式只有让它们更加隐形;既使看到,也很容易直觉地被当成劣质的管道而弃之如敝屣。

Granovetter从网络的角度入手,针对专业、技术、管理工作者的实际求职经历进行调查,发现既使在先进国家的专业职场,网络动力还是生龙活虎地发挥着无形的力量。譬如,研究发现,越是初出校园的菜鸟,越倚赖公开的正式管道来获得现职的信息。老鸟则越来越多经由非正式的管道(譬如,亲友的转告)获得目前的职位。换言之,菜鸟初入江湖、人生地不熟,只能倚赖公开「广播」(broadcasting)的信息,而老鸟则能够同时从业界的无形之网中汲取机会。

更惊人的发现是,那些经由「非正式管道」获得工作机会的老鸟,比起那些只能倚赖正式管道寻找工作的同侪,普遍享受更好的工作待遇、更满意的工作品质。原因之一是,越是在高阶、关键、或者创新事业的选才上,有关人格资质(领导风格、创造与想象力、团队意识等)的隐晦信息越形重要,而这些信息往往只能透过非正式网络中搜集或确认。此外,这些位子的更动往往更容易触动到人才流出与流入公司的神经,人事异动甚至会引起业界的余波荡漾,因此只能如鸭子划水般间接打探、迂回试探才能敲定。

甚至,许多受访者的陈述透露,这些透过「非正式管道」传输的工作机会,常常不是刻意搜寻来的,而是在各式的社交场合中无意间「撞上」的:「我去参加大学校友会,碰到以前的室友A…」、「有一次去拜访客户,结果聊到…」、「我在研讨会认识的新朋友刚巧知道这个消息,他想到了我,于是…」。这里的重点不是,这些工作(创业、跳槽)的机会如何地出于偶然;而是,你是否处在一个让偶然与奇迹更容易不期发生的丰富网络。

随着你的生涯累积,你是越来越融入到茫茫人海里信息流通的网络节点,还是越来越陷到网络边缘的孤儿位置?一个产业的老鸟,如果仍只能靠翻报纸与上网人力银行来寻求转职的机会,反而可能是网络老化的危险征兆。

成天上网的「蜘蛛人」,或许该学着偶而关掉计算机,打通电话给久未联络的朋友聊聊近况。「忙,才要约你喝杯咖啡」会是个好理由。润滑一下你早已生锈僵化的网络资本吧!为了丰富人生,也为了事业发展,两全其美,天底下还有更好康的事吗?



NEXUS
〈天下文化〉最近出版了物理学者Mark Buchanan的书《连结》(Nexus:Small Worlds and the Groundbreaking Science of Networking)。书拿到手中,有兴奋也有感慨。兴奋的是,network analysis一直是经济社会学的主干之一,也是经济社会学自1980年代以后复苏与成长的主要动力,但是经济社会学这方面成绩斐然的研究成果却一直没有什么社会影响与能见度。如今靠着物理学者的加持终于可以获得肯定。

感慨的是,正是在这个事实上,同时也显示了学科位阶的权威体系。经济学面对其它社会学科时常以「与自然科学并列的社会科学」为傲,不用多去理睬其它学科。社会学如今因物理学者的欣赏与推荐多了些曝光的机会,多引起些注目,骨子里正好彰显了制度权威的逻辑。话又说回来,社会学被自己的「洞见」所困,这种反身性(reflectivity)光照下的发现,让人有点哭笑不得。社会学者身处在这种权力之网中到底该不该玩这种endorsement的游戏?又需要多么小心,才不会玩火反而惹祸上身(backfire)?

Richard Stone在《科学》(Science)杂志上这样推荐:

「在《连结》这本书中,Buchanan剥去了复杂的外皮,让我们看到了把社会凝聚在一起的简单鹰架。这个新的世界观,带来的结果既深刻,又不时令人震撼」。

本书里一再被引用的社会学者Granovetter,在社会学界里鼎鼎有名,许多有读没读的人,都喜欢拿「弱连带」、「强连带」来引一引。那篇文章据说是社会科学里被引用次数最多的论文之一。但老实说,引用泛滥的程度已经到了让人觉得腐锈,甚至扭曲到无可忍受的地步。我看Buchanan的介绍,有些汗颜,物理学家最起码还抓住了这个「世界观」以及其理论逻辑的核心。

想到这里,心底除了兴奋、感慨之外,又多了点尴尬。我们还是应该要承认,以吸收人才的能量(input)来看,平均而言,物理学>经济学>社会学,这样的排列大半是事实。这跟社会学本身的价值可是一点关系也没有。

同时,given the previous factor intact,人一旦进入学问的制度圈圈后的生产力,又是另外一回事。有多少物理学者能不自限地敞开心胸「向下」学习,而又能够有跨越学科分界的欣赏品味与雅量?

就这点,我感觉,经济学者是输物理学者的。至于,社会学者呢?

Sorry, No Comment.

回复文章:



作者:韩宪平 发表时间:04年6月16日 7:41
“六度分隔”理论不知道是否已经有了严格的数学证明,我相信肯定得用图论技术来证明它;欧美国家的企业高层管理已经在用网络分析技术分析企业和组织内部的组织结构,用统计学方法找到信息流的结构特征,以提高组织效率;哈佛商学院的教授ALVIN ROTH使用网络分析的匹配(MATCHING)技术,为全美国的医学生就业市场设计择业程序,解决了几十年来的医学生就业市场的积弊;图论对与“网络动力学(NETWORKING DYNAMICS)和网络传播的分析是强有力的工具,肯定能得到丰富的成果。

一个新方向:面向全局拓扑的网络算法
                 博客中国专栏作家:韩宪平

  去年八月以来我注意到关于搜索业务和市场激动人心的场面,可为“大泽龙方蛰,中原鹿正肥”,微软公司斥资数亿美元角逐搜索市场,微软的头儿认为搜索、门户、协同和工作流是当今IT最看好的;YAHOO宣布不再使用GOOGLE的搜索服务转而自行开发,不久前投资16亿美元收购搜索公司OVERTURE,这使得搜索业务占了公司总营业收入的20%;而GOOGLE感到了迫在眉睫的压力,一方面提高自己的搜索技术,并收购了以搜索见长的KALTIX公司(他们的技术能评估网络广告的效果)以此增强自身的市场竞争力;IBM的WEBFOUNTAIN是基于文本内容分析的,每周分析数百万网页,为客户评估广告效果发现新的商业机会;欧洲知识管理集团ARK-GROUP指出在IT衰退时期,只有搜索业务一支独秀仍以衰退前甚至更高的速度增长着;最近关于TOOLBAR的竞争开局和GOOGLE公司的一些搜索技术(列表)被诉侵权也颇有看点。

  以往的网络算法可以说是“微观”特征的,即面向编码的,有一个包含内容记录列表的库,用编码在库内遍历实现匹配;PageRank好象是介于微观和宏观之间的,除了商业的目的外,它是基于统计学的,基于一定范围内网站网页的链接和统计分布;而所谓“全局拓扑(GLOBAL TOPOLOGY)”是借用微分几何学的概念即研究流型的大范围的拓扑性质的如连续和连通性、拐点存在性等。

  2002年NEC有一篇研究报告,指出根据图论“最大流-最小割定理MAX-FLOW MIN-CUT THEOREM”导出的算法,能够在网络上识别出一个区域或社区(COMMUNITY)来,这种算法是面向全局拓扑的即一个范围内的网流结构和性质的,一个区域有一个“源SOURCE”和一个“陷SINK”,还有一个“割CUT”即所谓瓶颈。作为源的网络节点的网流量流入的大于流出的,而作为陷的节点的网流量流入的大于流出的;我们以往总是在消极的意义上理解瓶颈,现在瓶颈对网络分析有重要的作用,对于确定一个网络区域或社区至关重要,割是介于一个网络区域的源和陷之间的几个数量相对较少的链接集合,它决定这个网络区域的最大网流量。

  NEC给出的算法叫“网络区域识别算法WEB COMMUNITY IDENTIFICATION ALGORITHM”,认为网络具有自组织、自适应和自相似-分形等性质和拓扑特性:网络的无组织状态是由所谓的“种子SEED”网站实现自组织的;网络自动实行经济原则如是网流达到最大、路径最短等;网络在任何尺度上都是分形结构自相似的,大区域套着小区域,每个区域都有源有陷有割。

  一旦识别出网络区域,那么区域内的信息流就是相对稳定的,信息的内容和信息流量都是稳定的,这可以帮助政府和网络服务公司检测监管网络异常如网络攻击,比较容易过滤垃圾邮件;可增强搜索引擎的功能,提高智能水平;可用于知识发现,由于网络自组织的特性可以比较容易发现学科之间互相交叉混合生长的动态趋势,把握住科学技术发展新的方向;评价网络广告效果,进行客户调查,发现新出现的商业机会。NEC根据这样的理论设计了网络实验,他们选择了三位著名科学家(分子生物学佛郎西斯 克拉克,理论物理学斯迪芬 霍金和计算机科学罗那德 莱卫斯特)的个人网站作为种子网站,确定出三个网络社区即三个兴趣中心,得到了许多重要结果,证明符合理论分析结论,发现了所谓“特征词和特征词组”,提示新的科学概念之间的未被发现的联系。

  全局拓扑算法的要点:

  (1)确定种子网站;

  (2)根据种子网站确定一个区域内的源、陷和割的全局结构(区域内普通节点的流入流出量是相等的,源的流出大于流入,陷的流入大于流出);

  (3)确定区域的割即瓶颈。

  开发工具:SERVLET/JAVA是服务器端的应用程序,工作模式是“查询-回答”与远程机器上运行的进程进行交互,它可以作为容器来集成像RMI/JAVA和RPC/JAVA这样的各种对远程机器上运行的进程的调用工具,他们可以探测远程机器之间的超链接、网流容量和网流密度分布
标签集:TAGS:
回复Comments() 点击Count()

回复Comments

{commentauthor}
{commentauthor}
{commenttime}
{commentnum}
{commentcontent}
作者:
{commentrecontent}