通过两个例子看概率统计计算前提条件的不确定性与计算结果的关系
首先必须明确这样一个事实:概率统计计算永远是不确切的计算,在生活当中,概率统计至多只能预测事情的发展变化或者推测总体的某些状况,然后给出一个永远不能作为定论的判断结果。它只谈及“有可能”、“有多少可能”这样的话题。
鉴于此,无论多么“精确的”统计结果,也只能是一种不确定的判断,只不过在实际生活中,这个给出了“可能性”大小的结果会给人们的行为和研究带来一些“似乎”可以相信和放心采纳的指导。
而这种不确定性,不仅表现在结果上,更表现在概率统计计算的前提条件上。根据所获得的前提条件和计算方法的不同,往往能得出不同的结果。
下举两例说明之。
例一:
笔者在高考之后,为了能够有效地填报志愿,需要了解自己在全省(黑龙江省)的排名情况。黑龙江省的成绩排名不对外公布,但是当时的高考查分系统设计的并不完善,任何人都可以在不知道相应考生考号的情况下,通过考生的姓名或姓名关键字查出高考分数。(比如输入“刘”查询,可以查出所有刘姓考生的考分)
查询统计在黑龙江省黑河市电大计算机房进行。查询系统是东北网(http://www.northeast.com.cn)的高考查分系统。
笔者选择了“张王李赵刘……”等最为常见的姓氏40余个,并尽可能多的用自己当时所能想起的姓氏作为查询条件进行查询,共查询出11万余考生的高考成绩(黑龙江当年参考人数为13万)。
利用word软件的“宏”功能对这十一万条数据进行整理,去掉冗余信息(考号,单科成绩,多余的表格格式,以及重复记录),然后汇总排序。(总过程由局域网内五台计算机共同计算完成)
笔者的高考分数为584分,在这十一万条记录中584分以上的记录有700条左右,占总记录条数的0.615%,推广到整个13万考生则584分应为800名左右——这是文理混合的计算结果,根据文理考生数量比例计算(文科:理科约为1:3)我的文科全省排名应为200名左右。
几天之后,黑龙江省之外的各省纷纷出分,根据各省公布在网上的分数结构可以知道同样的分数在其他省份的排名;根据各省总考生人数又可推测相同的分数结构下我在本省的排名情况。
用这种方法计算584分的排名情况,最低为利用山东省分数构成计算——200名;最高为利用天津市分数构成计算——120名。
后来得到更为确切消息,584分不分文理全省排名625,单算文科的话589分是整100名,由此推断我的真实名次应在125名左右。
上边推测名次,所知的条件不同,所用的方法类似,结果却不尽相同,这是一。
例二:
这是一个几何悖论。在一个圆内任引一弦,这根弦的长度大于圆内接等边三角形的概率是多少?
这里给出几种比较经典的解法(摘自《数学娱乐问题》,有改动):
解法一:如右图
在直径AO上取一点E,令OE=OD,则有:
过E并垂直AO的弦与BC平行且相等。
推出:任何夹在E、D之间并垂直于EO的弦长均
大于BC,此推论可应用于任何方向的内接
正三角形
又在E、D之间并垂直于ED的弦的数量,应该正
好是垂直于这条直径的弦的数量的一半。
由上推出,题中所求概率应为 。
解法二:
在大圆内接正三角形内再作一个内接圆。
考虑圆中所有可能画出的的弦的中点,可以发现,
只要这根弦的中点在小圆之外,其长度必小于BC,
而反之则大于BC。
问题转化为讨论弦的中点落在哪里的问题。
小圆的面积是大圆面积的 ,则判断这个中点落在
小圆内的概率为 ,既题中所求概率为 。
解法三:
过三角形的顶点之一A引圆的弦。
容易看出,AE>AC而AD<AC
即:当E点落在弧BC上,AE>AC;
当D点落在弧AB或AC上,AD>AC;
,而过点A的弦可以在 的
范围内引,所以推断AE出现的可能性为 。
即所求概率为 。
解法四:
还是利用上题的图形和思路,AE>AC>AD。
AE在圆中扫过的扇形面积与整个圆的面积之比为14:23,即所求概率为14:23。
分析:
四种解法得出了四种不同的答案,这充分说明了计算方法不同,所得到的概率统计结果不同。
就上述四种解法而言,虽然都看似有理,但其中必有三种甚至是四种全为错误解法,错误之处并不是一望可知,由此可见计算方法对概率统计计算的结果影响巨大。
仅就本题而论,第一、二、四种解法涉及到一个“无限”的问题,即用点或线这种没有面积或宽度的东西来进行有关于长度和面积的推断,就好像在讨论无限的空间里用一个质点(本没有体积)的体积来计算其出现的概率一样,可信度较低。个人认为第三种解法用角度计算,不涉及面积和长度,比较可能是正确解法。
综上所述,概率统计计算本身就是一种没有确定结果的运算,在计算之前,无论是事先已知的数据条件,还是计算方法,又存在着极大的不确定性,导致运算结果的不准确。
概率统计本身就是一种针对“可能性”的非确定性计算,其计算目的不过是提供一种参考,预测一种可能的发展方向——这就表明了这种方法对生活的指导;另一方面,概率统计运算本身存在着极大的不确定性,依赖这种运算又有可能对生活造成极大的负面影响(比如高考志愿填报失误——就本文来看——刘宇翔)——这种影响的可能性(很矛盾的)又可以通过概率统计进行精确运算(虽然是不确定的),这不属本文讨论范围,不再多说。
回复Comments
{commenttime}{commentauthor}
{CommentUrl}
{commentcontent}