gauge
发表文章数: 596
内力值: 375/375
贡献度: 8310
人气: 1396
|
统计数字与伪科学 [文章类型: 原创]
中国国内外的差别确实很大。国外即使是伪科学也比国内的要高明。
Jaynes``Probability theory:Logic of science".Ch5
Stewart夫人声称自己具有超距感觉能力,简称为ESP.比如,在$5$张纸牌中随机抽取$1$张,Stewart夫人认为自己猜中纸牌的能力超过普通人。有人对Stewart夫人进行过测试。测试一共进行了$37100$次,而Stewart夫人猜中的次数为$9410$次,猜中的频率差不多等于$0.2536$,亦即差不多$1/4$.粗略的看起来,这个$1/4$也不算太离谱。但这仅仅是粗略的看起来而已。事实上,这是极其不可能的。如果仅仅依靠纯粹的猜测,在$5$张牌中随机抽取一张,猜中$1$张的概率为$0.2=1/5$.这个概率和$0.2536$差别不是非常大。仅仅依靠猜测,在$37100$次测试中猜测正确的次数大致上为$37100\times0.2=7420$次。按照中心极限定理,$37100$次试验可以用正态分布来近似。这个正态分布的平均值为$7420$,而方差为$\sqrt{37100\times0.2\times(1-0.2)}\approx77$.因而猜中$9410$次与标准的预测值相差
$$
\frac{9410-7420}{77}=25.8
$$
个标准差。由此可以可以估计出在$37100$次测试中,如果猜中的概率为$0.2$的话,那么猜中
$9410$次的概率小于
$$
3\times10^{-139}.
$$
同样也可以估计猜中次数超过$9410$的概率,和上述概率很接近。这是一个小得异乎寻常的数字。
因而,Stewart夫人在$37100$次猜纸牌测试中猜中$9410$次是一个非常难以令人置信的事情。国内的伪科学家还在试图说明他们的伪科学的成功率达到$90\%$,由此看出老外的知识面比中国人要广,连伪科学都搞得象模象样的。实际上只要比正常的预测值稍大,就可以导致异乎寻常的小概率。ESP研究者可以据此认为ESP的存在是确定无疑的。当然,这也仅仅是信奉这一点的人这样看待他们的测试数据。
那么如何解释Stewart夫人的超感觉能力呢?如此小的概率,看来只能确认Stewart夫人的ESP了。果真如此吗?
我们看看用Bayesian统计如何分析这个案例。
对于一个具有一定科学常识的人来说,无论如何,他都会拒绝Stewart夫人具有ESP.即使有试验的数据,他仍然要拒绝这个伪科学的结论。那么这个人会得出什么样的结论呢?具有科学常识的人会认为``Stewart夫人不可能具有ESP".那么得到这样一个极小的概率只能说明一件事,那就是这个试验是有缺陷的,试验中有某些不为普通人注意而Stewart夫人能够利用的因素使得她可以提高猜测的能力。这些因素可能来自试验人员有意无意的行为,也可能是由于Stewart夫人的某些特质,比如善于观察测试人员的神色等等。这样的因素很多,为简单起见,不妨只考虑一个这样的因素。
现在我们有$3$个假设。
其一,随机猜测一张牌,概率为$p=0.2$.
其二,Stewart夫人表现出来的猜测能力,即猜测正确的频率$f=0.2536$.
其三,试验的缺陷因素,不妨设$q$,并假设$q$是一个与$f$很接近的数,$q\approx f$.
对其中每一赋予一个先验概率,依次设为$P(p),P(f),P(q)$.以$D$表示试验数据,亦即“在$37100$次测试中,Stewart夫人猜测正确$9410$次。”记号$P(D|p)$,表示“如果Stewart夫人的猜测能力为$p$,并且在$37100$次测试中,Stewart夫人猜中$9410$次”这一事件发生的概率。记号$P(f|D)$,表示当$D$发生后,Stewart夫人的猜测能力为$f$的概率。这里所有的概率都是主观概率,亦即仅仅表示某个人对这些事件的判断。这个人可以是一个科学家,也可以是一个受到科学教育很少、从而容易接受伪科学的人,这些人将对这些事件赋予不同的先验概率。另外,我们的分析作了很多的简化,显然只考虑上述$3$种情形,这并不影响最后的结论。在这些假设之下,我们看到后验概率为
\begin{eqnarray*}
P(f|D)
&=&\frac{P(f)P(D|f)}{P(f)P(D|f)+P(p)P(D|p)+P(q)P(D|q)}\\
&=&\frac{1}{1+\frac{P(p)}{P(f)}\frac{P(D|p)}{P(D|f)}+\frac{P(q)}{P(f)}\frac{P(D|q)}{P(D|f)}}.
\end{eqnarray*}
发表时间: 2007-02-11, 02:34:24
|
个人资料
|
|
gauge
发表文章数: 596
内力值: 375/375
贡献度: 8310
人气: 1396
|
Re: 统计数字与伪科学 [文章类型: 原创]
对于一个具有科学头脑的人而言,无论发生了什么样的事情,他都认为Stewart夫人不大可能具有ESP.亦即后验概率$P(f|D)$是一个很小的数,$P(f|D)\ll1$.注意到,根据前面的计算可知如果不假定$\frac{P(p)}{P(f)}$是一个极其巨大的数,那么表达式中的项
$$
\frac{P(p)}{P(f)}\frac{P(D|p)}{P(D|f)}
$$
是可以忽略的。又由假设$P(D|q)\sim P(D|f)$.这样$P(f|D)$可表达为
$$
P(f|D)=\frac{1}{1+\frac{P(q)}{P(f)}}.
$$
$P(f|D)\ll1$等价于$P(f)\ll P(q)$.亦即该项试验有缺陷的概率很大。因而对于一个具有科学头脑的人来说,这些离奇的试验结果只能使得这些人怀疑试验中存在着巨大的缺陷。同时我们看到,
$$
P(f|D)\approx\frac{P(f)}{P(q)}=\frac{\mbox{猜测能力为f的概率}}{\mbox{试验缺陷为q的概率}}.
$$
与试验结果无关。Jaynes等人对于这个问题的讨论,都认为所得到的数据越离奇,试验的缺陷越大。
但这些讨论中没有人把$P(f|D)$的表达式的最终形式写下来。从写下来的式子容易看出,这与试验的结果无关。实际上,有一个中间步骤把与试验有关的项$P(p)P(D|p)$简单的去掉了。
通常,Bayesian试图用这个例子来说明可以用Bayesian推断来给出一个很好的理解。但上述计算的结果显示并非如此。此处Bayesian没有告诉我们任何额外有意义的东西。
注意到书还没有彻底完成,Jaynes就去世了。或许Jaynes还没有来得及做进一步的修改。我们重新分析一下,以完成Bayesian的意愿。回顾。
数据。随机猜测的准确率$p=0.2$,Stewart夫人猜测正确的频率$f=0.2536$,试验中可能的缺陷概率$q$.$q$未知,且有多个,为简单起见,假设只有一个。测试的次数$n=37100$,猜中的次数$k=9410$.
先验假设。随机猜测$p=0.2$的先验概率$P(p)$,Stewart夫人的猜测能力为$f=0.2536$的先验概率$P(f)$.试验缺陷$q$的先验概率$P(q)$.则有后验概率
\begin{eqnarray*}
P(f|D)
&=&\frac{1}{1+\frac{P(p)}{P(f)}\frac{P(D|p)}{P(D|f)}+\frac{P(q)}{P(f)}\frac{P(D|q)}{P(D|f)}}\\
&\approx&\frac{1}{1+\frac{P(q)}{P(f)}\frac{P(D|q)}{P(D|f)}}\\
&\approx&\frac{1}{\frac{P(q)}{P(f)}\frac{P(D|q)}{P(D|f)}}\\
&\approx&\frac{P(f)}{P(q)}\frac{P(D|f)}{P(D|q)}\\
&=&\frac{P(f)}{P(q)}\frac{C_n^kf^k(1-f)^{n-k}}{C_n^kq^k(1-q)^{n-k}}\\
&=&\frac{P(f)}{P(q)}e^{k\log(\frac{f}{q})+(n-k)\log\frac{1-f}{1-q}}\\
&=&\frac{P(f)}{P(q)}e^{n\frac{k}{n}\log(\frac{f}{q})+n\frac{n-k}{n}\log\frac{1-f}{1-q}}\\
&=&\frac{P(f)}{P(q)}e^{nf\log(\frac{f}{q})+n(1-f)\log\frac{1-f}{1-q}}\\
&=&\frac{P(f)}{P(q)}e^{nH(f|q)}\\
\end{eqnarray*}
其中$H(f|q)=f\log(\frac{f}{q})+(1-f)\log\frac{1-f}{1-q}$为相对熵。由凸函数的性质容易证明$\forall f,q\in[0,1]$,$H(f|q)\geq0$.且仅当$f=q$时,$H(f|q)=0$.例
$H(0.2536|0.25)=3.44503\times10^{-5}$.
$H(0.2536|0.24)=0.000500671$.
$H(0.2536|0.2)=0.008452103$.
$H(0.2536|0.27)=0.000691331$.
$H(0.2536|0.3)=0.005293983$.
因而,为了使得$P(f|D)\ll1$,只能是如下两种情形,
$(1)$ 或者$q$很接近于$f$,同时$P(f)\ll P(q)$.即造假的可能性很大。
$(2)$ 或者$q$与$f$相差较大。这意味着Stewart夫人的实际能力没有测试出来的那么高。
Jaynes说,这是ESP研究者的两难困境。确实如此,或者他们的数据很离奇,使得有一定科学头脑的人对于其试验持怀疑态度,认为试验有重大缺陷。或者他们的数据不那么离奇,但这时又不能用来证明他们希望的ESP.
我们来看看用上述的分析方式来讨论伪造试验数据的现象。某些人伪造的试验数据介于伪科学的两难境地之间。他们的数据不那么离奇,但又不太寻常。这使得上述分析失效。一方面,其数据不太寻常,使得其试验结果可以发表在较好的杂志。反过来,不太寻常的数据总是令人怀疑的。另一方面,其数据又不那么离奇,所以怀疑者多半会抱着将信将疑的想法。亦即虽然怀疑,却又不能很明确的断定试验数据是伪造的。也就是说,这些人打的是擦边球。
由此看出,统计学的能力到此为止,仅仅依靠统计学不足以断言试验数据是否属于伪造。必须依靠相关学科的知识、其他人的重复试验、检查原始数据等等手段才能够判断不太寻常的数据是否属于伪造之列。实际上,即使在Stewart夫人的ESP测试中,我们也不是通过统计学看出来其问题所在,而是通过科学常识来判断的。这也正是我们反复强调的上述的分析是对于一个持科学态度的人按照Bayesian统计推方法断能够得到的结论。一个没有科学常识的人即使Bayesian统计方法,也不能够得到有效的结论。Bayesian对于ESP问题的讨论,给人的印象是:事后诸葛。
发表时间: 2007-02-11, 02:34:43
|
个人资料
|
|
laworder
发表文章数: 89
内力值: 139/139
贡献度: 1863
人气: 91
|
Re: 统计数字与伪科学 [文章类型: 混合]
中国国内外的差别确实很大。国外即使是伪科学也比国内的要高明。
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
Exactly.
经过28年的运作,饱受非议以后,普林斯顿大学的ESP 和意念致动(telekinesis)实验室昨天宣布将于本月底正式关闭。原因是此类研究使该大学蒙羞并使学术界愤怒(embarrassed the university and outraged the scientific community)。
此类实验室在西方其实还不少。例如剑桥大学Josephson教授的心─物统一实验室。
从其所受的训练,研究手段与研究功力看,他们比中国很多做常规科学的人要来得更真一些。里面有像Josephson这种少年得志拿诺贝尔的人。要说他们在做伪科学其实有欠公允。
中国的伪科技不发达,与其真科技不发达的原因是一样的:就是不够认真,不是真的迷于某个问题及其解,对科技缺乏真爱,心里想得更多的是如何出名发财入仕之类的。
人能理解世界是最大的科学之谜。
发表时间: 2007-02-12, 04:42:07
|
个人资料
|
|