特别策划:Alexa中国网站排名真相调查 [ 2005-01-11 ] [ 作者:人民网 ]
“Alexa排名”已经是国内网站的站长们嘴边最常挂的单词。那么,这个Alexa是干嘛的?它凭什么令国内网站侧目?Alexa有哪些鲜为人知的秘密?记者通过深入调查和采访,努力为读者还原一个真实的Alexa。
Alexa是谁?它如何给网站排名?
·核心提示:
1、用户下载的工具条是Alexa惟一的信息获取来源,对于没有下载工具条的用户,Alexa则无法统计。这样,下载工具条提高排名成了一些网站的惯常手段。
2、Alexa通过分析工具条返回的数据来排网站“座次”
1996年4月,Alexa在美国创立,那时它只是一个小网站,主要做分类导航。1999年,Alexa被其它企业收购。
Alexa赖以成名的是那个被四处引用并被媒体多次炒作过且引发了巨大争议的全球网站排名。按照Alexa网站上的“官方声明”,Alexa公开的那份全球网站总排名是通过收集所有Alexa工具条返回的信息,经过计算得出的综合排名。从这份“官方声明”中,我们不难看出,影响Alexa排名的因素是两个,一是Alexa采集的信息,二是Alexa对这些信息进行深加工的计算方法。
在Alexa网站上,人们可以针对某个特定网址去查询其所属的网站的访问人数,Alexa提供了一个叫做"每百万用户访问人次"的数据来表示访问人数,这个数据指的是每一百万个Alexa工具条用户中每天访问某一网站的平均人数。
仅有访问人数,还不足以反映一个网站被网民浏览的情况,Alexa还提供了另一个数据来反映到访的网民对特定网站的使用率,这就是"每用户浏览页面数"。某网站的"每用户浏览页面数"是每天所有访问该网站的Alexa工具条用户在该网站上浏览的总页面数的平均值,而同一人对相同页面的重复浏览在每天只计作一次。
有了这两个数据,Alexa就可以给全球网站按综合流量进行排名了,它把网站的这个排名称作“流量排名”。
鼓捣出来的“权威” 难以置信的排名
·核心提示:
1、用户通过工具条能大大提高相关网站在Alexa中的排名
2、汇编高手大都有能力利用Alexa漏洞作弊 提高排名
在一个国外的BBS上,很多个人网站的站长彼此分享提高Alexa排名的经验。一个名为rodpuga的用户说:“仅仅通过我每天正常地访问我的网站中的一个,我就能把排名前移50万位。我才安装了Alexa工具条两周时间!这个网站已经从第10万名跳到了第1万5千名。”另一个署名Bogglesworld的用户说:“两天前我安装了Alexa工具条,单位装了一个,家里装了一个。我已经从大约第10万名跳到了第3万名。这就是说只要安装一个或两个Alexa工具条,就能大幅度地往前跳。”
要想彻底搞清楚Alexa排名是否可信,必须从技术上对Alexa的全球网站流量监测进行全面的解剖,当然,Alexa从来没有公布自己的技术细节,记者决定“以彼之道,还施彼身”,既然Alexa声称其数据来源就是那个工具条,记者决定首先从破解工具条入手。
受记者委托,圈内著名的Web技术专家小林,用了近一个晚上的时间,对Alexa工具条及其向Alexa返回的数据进行了细致的分析,得出了很多宝贵的第一手资料。多年前对Alexa就做过研究的小林认为,最近的这次分析揭示了一些Alexa更隐秘的技术细节。
小林告诉记者,现在最新版本的Alexa工具条的运作机理与以往没有太大的改变,每当用户以装有Alexa工具条的IE浏览器打开新页面时,Alexa的一台服务器都会收到加密的数据包,这个数据包中的核心信息就是十几个参数,这些参数包括当前网页地址、页面打开时间、用户端显示分辨率、Alexa工具条版本号、该用户是否为“亚马逊”的用户等,其中有一个重要的隐含参数,经小林分析,认为是Alexa为每个已安装的工具条自动生成的ID号码,这个号码应该是全球惟一的。Alexa可以通过这个ID对每个反馈数据包的发出者进行惟一标识,这是解决"每用户浏览页面数"重复计算问题和防止同一用户多次刷新作弊的一个重要手段。
小林告诉记者,从目前研究的结果来看,任何一个汇编高手都可以很容易地掌握Alexa工具条返回的数据包中的秘密,如果这个人同时也是一个网络编程高手,那么要针对Alexa作弊就比较容易了。从记者后来对一位上海的Alexa作弊高手的采访来看,小林的分析完全正确。该作弊者正是一位资深的Web开发工程师,其采用的手段与小林的分析也基本吻合——编写一个Alexa工具条返回码生成器,批量产生Alexa能够辨识的代码串,然后用虚拟多用户的方式发回data.alexa.com,这样就可以欺骗Alexa的服务器,让它误以为这些数据是不同用户发来的 。
小林认为,这种以编程方式模拟多用户访问的作弊方式的实现,最重要的环节就在于对那个Alexa用来惟一标识用户身份的ID号的生成算法的破解,这需要对足够多的Alexa工具条进行嗅探,抓取其数据包进行定量的算法分析。但小林同时也指出,这些工作对于一个编程高手来说,确实不算什么,只是最终作弊的实现仍需要模拟一个足够快的ID号生成程序,这可能会比较困难,不过据小林估计,国内能做这些事情的人不在少数,只是互联网这个圈子里的高手们很少去做罢了。
为了提高排名,某些中国网站不惜作弊
·核心提示:
1、Alexa无法防止网站作弊
2、Alexa工具在中国被大量下载
3、花钱就可购买排行数据
自2003年以来,一些网站在向投资人递交商业计划书的同时,开始有意无意地提一下自己的Alexa排名,按照某种大家默认的逻辑,排在全球300名的网站总是比排在全球1000名以外的网站更有价值。终于,在“圈内人”的口口相传中,Alexa排名在中国互联网上名声大噪,而此时,远在大洋彼岸的Alexa却对它的中国Fans们一无所知。
当Alexa排名开始得到业界的普遍认可时,终于有人开始利用Alexa排名来创造“价值”了。大批个人网站的站长们开始研究Alexa的排名规则,网上开始流传各种针对Alexa的作弊工具,很多网站上开始刊登介绍Alexa作弊方法的文章,各种论坛里开始出现对Alexa排名的讨论。一时间,中国互联网业界刮起了“Alexa旋风”。
在2003年底,针对这股Alexa热,一些业内人士又开始质疑Alexa排名的可信度,并揭发出很多网站作弊的“内幕”。事实上,有相当多网民都对Alexa的排名表示过怀疑,因为在2003年的大部分时间里,Alexa排名上的全球第三和第四的网站是两个韩国网站,Alexa对此的解释是,韩国的互联网用户中安装Alexa工具条的比例较高,因此Alexa在韩国网民中得到的采样数据比较高,这就导致韩国的两家门户网站进入了全球前五名。
统计专家通过技术分析得知,若国内互联网用户以总数9000万计算,则其中安装了Alexa工具条的用户可能已超过130万。按照Alexa声称的1000万左右的工具条全球下载总量来看,中国网民对Alexa的热衷似乎显得更为突出,这或许也可以作为国内网站2004年在Alexa排行榜中整体排名提高的一个解释。
而且,事情远没有这么简单,在Alexa网站上,记者看到全球网站前10万名排行榜的报价是499美元,显然,在大洋彼岸,还是有人认可Alexa的排名数据,甚至会花钱去买那个排行数据。
此外,对于前文中记者提到的以编程模拟Alexa工具条返回数据包的作弊方式,Alexa几乎没什么好办法去防范,甚至要探测到这样的作弊手段都比较难。
“Alexa排名”已经是国内网站的站长们嘴边最常挂的单词。那么,这个Alexa是干嘛的?它凭什么令国内网站侧目?Alexa有哪些鲜为人知的秘密?记者通过深入调查和采访,努力为读者还原一个真实的Alexa。
Alexa是谁?它如何给网站排名?
·核心提示:
1、用户下载的工具条是Alexa惟一的信息获取来源,对于没有下载工具条的用户,Alexa则无法统计。这样,下载工具条提高排名成了一些网站的惯常手段。
2、Alexa通过分析工具条返回的数据来排网站“座次”
1996年4月,Alexa在美国创立,那时它只是一个小网站,主要做分类导航。1999年,Alexa被其它企业收购。
Alexa赖以成名的是那个被四处引用并被媒体多次炒作过且引发了巨大争议的全球网站排名。按照Alexa网站上的“官方声明”,Alexa公开的那份全球网站总排名是通过收集所有Alexa工具条返回的信息,经过计算得出的综合排名。从这份“官方声明”中,我们不难看出,影响Alexa排名的因素是两个,一是Alexa采集的信息,二是Alexa对这些信息进行深加工的计算方法。
在Alexa网站上,人们可以针对某个特定网址去查询其所属的网站的访问人数,Alexa提供了一个叫做"每百万用户访问人次"的数据来表示访问人数,这个数据指的是每一百万个Alexa工具条用户中每天访问某一网站的平均人数。
仅有访问人数,还不足以反映一个网站被网民浏览的情况,Alexa还提供了另一个数据来反映到访的网民对特定网站的使用率,这就是"每用户浏览页面数"。某网站的"每用户浏览页面数"是每天所有访问该网站的Alexa工具条用户在该网站上浏览的总页面数的平均值,而同一人对相同页面的重复浏览在每天只计作一次。
有了这两个数据,Alexa就可以给全球网站按综合流量进行排名了,它把网站的这个排名称作“流量排名”。
鼓捣出来的“权威” 难以置信的排名
·核心提示:
1、用户通过工具条能大大提高相关网站在Alexa中的排名
2、汇编高手大都有能力利用Alexa漏洞作弊 提高排名
在一个国外的BBS上,很多个人网站的站长彼此分享提高Alexa排名的经验。一个名为rodpuga的用户说:“仅仅通过我每天正常地访问我的网站中的一个,我就能把排名前移50万位。我才安装了Alexa工具条两周时间!这个网站已经从第10万名跳到了第1万5千名。”另一个署名Bogglesworld的用户说:“两天前我安装了Alexa工具条,单位装了一个,家里装了一个。我已经从大约第10万名跳到了第3万名。这就是说只要安装一个或两个Alexa工具条,就能大幅度地往前跳。”
要想彻底搞清楚Alexa排名是否可信,必须从技术上对Alexa的全球网站流量监测进行全面的解剖,当然,Alexa从来没有公布自己的技术细节,记者决定“以彼之道,还施彼身”,既然Alexa声称其数据来源就是那个工具条,记者决定首先从破解工具条入手。
受记者委托,圈内著名的Web技术专家小林,用了近一个晚上的时间,对Alexa工具条及其向Alexa返回的数据进行了细致的分析,得出了很多宝贵的第一手资料。多年前对Alexa就做过研究的小林认为,最近的这次分析揭示了一些Alexa更隐秘的技术细节。
小林告诉记者,现在最新版本的Alexa工具条的运作机理与以往没有太大的改变,每当用户以装有Alexa工具条的IE浏览器打开新页面时,Alexa的一台服务器都会收到加密的数据包,这个数据包中的核心信息就是十几个参数,这些参数包括当前网页地址、页面打开时间、用户端显示分辨率、Alexa工具条版本号、该用户是否为“亚马逊”的用户等,其中有一个重要的隐含参数,经小林分析,认为是Alexa为每个已安装的工具条自动生成的ID号码,这个号码应该是全球惟一的。Alexa可以通过这个ID对每个反馈数据包的发出者进行惟一标识,这是解决"每用户浏览页面数"重复计算问题和防止同一用户多次刷新作弊的一个重要手段。
小林告诉记者,从目前研究的结果来看,任何一个汇编高手都可以很容易地掌握Alexa工具条返回的数据包中的秘密,如果这个人同时也是一个网络编程高手,那么要针对Alexa作弊就比较容易了。从记者后来对一位上海的Alexa作弊高手的采访来看,小林的分析完全正确。该作弊者正是一位资深的Web开发工程师,其采用的手段与小林的分析也基本吻合——编写一个Alexa工具条返回码生成器,批量产生Alexa能够辨识的代码串,然后用虚拟多用户的方式发回data.alexa.com,这样就可以欺骗Alexa的服务器,让它误以为这些数据是不同用户发来的 。
小林认为,这种以编程方式模拟多用户访问的作弊方式的实现,最重要的环节就在于对那个Alexa用来惟一标识用户身份的ID号的生成算法的破解,这需要对足够多的Alexa工具条进行嗅探,抓取其数据包进行定量的算法分析。但小林同时也指出,这些工作对于一个编程高手来说,确实不算什么,只是最终作弊的实现仍需要模拟一个足够快的ID号生成程序,这可能会比较困难,不过据小林估计,国内能做这些事情的人不在少数,只是互联网这个圈子里的高手们很少去做罢了。
为了提高排名,某些中国网站不惜作弊
·核心提示:
1、Alexa无法防止网站作弊
2、Alexa工具在中国被大量下载
3、花钱就可购买排行数据
自2003年以来,一些网站在向投资人递交商业计划书的同时,开始有意无意地提一下自己的Alexa排名,按照某种大家默认的逻辑,排在全球300名的网站总是比排在全球1000名以外的网站更有价值。终于,在“圈内人”的口口相传中,Alexa排名在中国互联网上名声大噪,而此时,远在大洋彼岸的Alexa却对它的中国Fans们一无所知。
当Alexa排名开始得到业界的普遍认可时,终于有人开始利用Alexa排名来创造“价值”了。大批个人网站的站长们开始研究Alexa的排名规则,网上开始流传各种针对Alexa的作弊工具,很多网站上开始刊登介绍Alexa作弊方法的文章,各种论坛里开始出现对Alexa排名的讨论。一时间,中国互联网业界刮起了“Alexa旋风”。
在2003年底,针对这股Alexa热,一些业内人士又开始质疑Alexa排名的可信度,并揭发出很多网站作弊的“内幕”。事实上,有相当多网民都对Alexa的排名表示过怀疑,因为在2003年的大部分时间里,Alexa排名上的全球第三和第四的网站是两个韩国网站,Alexa对此的解释是,韩国的互联网用户中安装Alexa工具条的比例较高,因此Alexa在韩国网民中得到的采样数据比较高,这就导致韩国的两家门户网站进入了全球前五名。
统计专家通过技术分析得知,若国内互联网用户以总数9000万计算,则其中安装了Alexa工具条的用户可能已超过130万。按照Alexa声称的1000万左右的工具条全球下载总量来看,中国网民对Alexa的热衷似乎显得更为突出,这或许也可以作为国内网站2004年在Alexa排行榜中整体排名提高的一个解释。
而且,事情远没有这么简单,在Alexa网站上,记者看到全球网站前10万名排行榜的报价是499美元,显然,在大洋彼岸,还是有人认可Alexa的排名数据,甚至会花钱去买那个排行数据。
此外,对于前文中记者提到的以编程模拟Alexa工具条返回数据包的作弊方式,Alexa几乎没什么好办法去防范,甚至要探测到这样的作弊手段都比较难。
回复Comments
作者:
{commentrecontent}