欢 迎 访 问 卢 昌 海 个 人 主 页

除了自己的无知,
我什么都不懂。

-苏格拉底

 
信 息
 
 
 
已发表作品列表
站长简介 | 常见问题
版权说明 | 电子信箱
 
统 计
 
 
 
自 2008-02-01 以来
本文点击数
12,691
自 2008-02-01 以来
本站点击数
15,966,227
昨日点击数 6,369
今日点击数 5,569

思维领域的若干误区

- 卢昌海 -

本文汇集了几篇短文, 主要介绍思维领域中几种常见的误区, 比如高估名人名言的用处、 盲信数字拟合的结果, 错判因果联系的存在, 等。 这些文章大都来自当年我在繁星客栈发表的贴子。

从 Planck 的一段话谈起

著名物理学家 Max Planck 在收录于《Scientific Autobiography and Other Papers》(《科学自传及其它文章》) 的自传中写过这样一段话:

一个新的科学真理的胜利并非来自于让它的反对者信服和领悟, 而是因为反对者逐渐死去, 而熟悉它的年轻一代成长起来了。

这段话出自一位功绩卓著的物理学家, 却又似乎漏洞百出, 在客栈里引起了一些讨论, 也令一些网友感到奇怪。

我觉得这是一个很好的例子, 它说明人们在讨论科学或科学哲学问题时常用的一种策略, 即直接援引科学家的言论, 并不总是具有论证效力的。 事实上, 在很多辩论中我们可以看到这样一个有趣的现象: 那就是正反双方都可以举出一些著名科学家的言论——有时甚至是同一位科学家的言论——来支持自己的观点, 或反驳对方的观点。 这种现象的出现, 一方面固然是由于不同科学家或同一位科学家在不同时期的观点有时是彼此相左的; 但更重要的原因, 我认为是由于科学家的许多言论都有着特定的背景及针对性, 但在表述时却没有清楚地加以界定 (或界定了却被引用者断章取义), 从而使人产生错觉, 以为那些观点有比它们实际具有的更大的普遍性, 也为人们误用那些观点开启了方便之门。

象上面所引的 Planck 那段话, 它的本意只是对当年 Boltzmann 和他与唯能论者的论战所作的感慨, 或许也夹杂了对后来包括他本人在内的一些经典物理学家无法象年轻人那样轻易接受量子力学的些许感慨。 其中提到的 “反对者逐渐死去”, 也可能只是指反对者的学术活跃期的逐渐终结, 而不一定是生命的终结。 如果我们把那段话当成是一种普遍论述, 就会产生漏洞百出的感觉。 我听说有些科学哲学论述甚至把那段话上升为所谓的 “Planck 原理”, 来详加分析。 那样的论述在我看来完全是捕风捉影、 故弄玄虚。

除了某些科学言论外, 大家喜爱的许多格言也具有类似的性质: 读起来朗朗上口, 不乏启示性, 在文章中引用起来也很精彩, 但细究起来并不普遍成立。 比如 Einstein 曾经说过: “常识就是人在十八岁之前积累的偏见”。 不知他有没有把基本的逻辑推理算做常识? 至于他还说过的 “世界上最难理解的东西是个人所得税”, 就更不必提了, 那想必是他老人家到美国后生出的感慨 :-)。

对于这些类型的言论, 我们可以套用一个 Einstein 的句式: Most quotes from scientists are instructive, but not too instructive. :)

那么, 在科学家的言论中如何识别相对重要的部分呢? 我建议的方法是看科学家是否对自己的某段言论加以阐述。 任何人都不可能保证自己的所有言论都面面俱到、 滴水不漏。 许多 casual 的言论往往在不经意间用了普遍陈述的语气, 真正的含义却很狭窄。 但一般说来, 特地加以阐述的言论通常不会是 casual 的言论, 因而会比较有价值 (加以阐述本身也说明科学家对该言论的重视)。 而且经过阐述的言论, 其适用范围往往会比较清晰——哪怕在阐述过程中没有明确指明适用范围, 一般也可以通过阐述本身来间接推断其适用范围。

数字拟合与神秘主义

很多伪科学人士喜欢对数字做神秘主义解读, 比如 “金字塔的高度乘以十亿等于地球到太阳的距离” (误差为百分之几), 等等, 有些人甚至将之视为 “神迹”。 早在念中学时, 我就想用一个最简单的方法来戳穿这种数字拟合的把戏。 方法很简单: 拿几个哪怕在伪科学祖师爷眼里也不会觉得有奥秘的数字, 来拟合出一些 “神迹” 给大家看看, 这样大家就可以体会到所谓 “神迹” 是多么地一文不值。 这个想法存念已久, 却一直懒得实施。 今天在观星楼看到有人介绍某些 “研究”, 不禁让我又想起那种数字拟合的把戏来。 不妨就选今天来实践一下我的戳穿术吧。

我们随便拿几个与客栈有关的数字:

  1. a = 700 (客栈自 2003 年 11 月 13 日重开至今的天数)
  2. b = 15427 (客栈截至写作本文为止的各论坛帖子总数)
  3. c = 1054 (站长所发的帖子总数——不包括这个帖子本身)

我们来看看, 这些数字包含了什么样的 “神迹” 吧:

  1. 首先, c 传递了一个很重要的历史事件的信息: 公元 1054 年地球上的人类观测到了一个超新星;
  2. 其次, 站长所发帖子占帖子总数的比例乘以 2000 (即 2000*c/b) 为 137, 恰好是精细结构常数的倒数 (误差不到千分之三);
  3. 其三, 站长每天所发帖子数 (c/a) 乘以一亿恰好是地球到太阳距离的公里数值 (误差不到百分之一, 比金字塔强多了);
  4. 其四, a/c 的有效数字 6.64 恰好是 Planck 常数的有效数字 (误差不到千分之二);
  5. 其五, log(b) = 4.19 恰好是热功当量的有效数字 (误差不到千分之一)。

时间关系就不多写了, 这应该已经可以跟金字塔里的数字奥秘相比拟了。 感兴趣的读者可以自行补充, 只要找一本科学常数表, 花上一两个小时, 发掘它一二十个 “神迹” 不成问题。

当然, 有人可以反驳说, 这里忽略了物理单位。 这种反驳是很容易对付的, 只要找一些量纲相同的数字 (比如某辆自行车上若干个部件的线度), 稍稍花点时间, 就可以构造出与物理上的无量纲或长度量纲的常数能附会的结果。 上面的例子很好地说明了从几个无论什么样的数字中构造出 “神秘” 的拟合是何等容易。

从气功治癌说谈起

气功治病是一种流传已久的说法, 这其中犹以气功治癌说最引人注目, 因为在许多据说是气功治癌的例子中, 癌症患者已被医院判定为无救, 但练习气功后却延续了生命, 甚至康复了。 很多人把这看作是气功具有治癌作用的例证, 练习气功的人以及气功活动的组织者更是把这些视为铁证加以宣传, 这是气功治癌说的由来。 那么这些例子是否真的构成对气功治癌说的有效证据呢? 我们先来看看那些例子是什么样的。 所有那些例子都是由下面两条构成的:

  1. 那些病人练习了气功。
  2. 在练习气功若干时间后他们的癌症减轻或痊愈了。

这两条放在一起, 时间上一先一后, 很容易给人造成一种彼此相关的印象。 但实际上, 没有一种单纯的逻辑推理能够从这两条中推出 1 与 2 具有因果关联的结论。 举个例子来说, 如果我在做一百件事之前都进行了祷告, 那么很可能其中有几件事按我的心愿实现了。 对于这几件事, 我可以说:

  1. 我事先做了祷告。
  2. 在我祷告后事情按我祷告的方式实现了。

但是很明显, 这丝毫不表明我的祷告是那几个个例实现的原因。

只有在一种情况下, 这种个例可以直接作为在 1 与 2 之间有可能存在因果关联的例证 (请注意是 “有可能”, 并且只是 “例证”), 那就是如果通过其它知识我们已经知道 2 要么完全不可能发生, 要么只能在 1 发生的前提下发生。 在这种情况下, 只要确认发生了上述个例 (哪怕只有一个个例) 也构成了对该个例中 1 与 2 有可能存在因果关联的例证。 对于癌症来说, 这种情形对应于癌症患者 (在未经医学治疗的情况下) 要么不可能康复, 要么只能在练气功的前提下康复。 那么癌症患者在未经医学治疗的情况下是否真的完全不可能康复呢? 答案是否定的。 因为医学界早就注意到了癌症具有一定比例的自然康复现象。 这一比例据说为 3%-5% (这在网上及书面文献中可以查到, 具体的数据可能因资料而异, 但对本文的讨论来说重要的是: 这一比例不为零——即自然康复现象是存在的)。 既然存在自然康复现象, 那么对上述个例起码就有两种可能的解释: 1. 是气功具有治癌作用; 2. 是自然康复现象。 而在 1 中还可以进一步分出: 1a. 是 “气” 或其它据称是气功特有的东西具有治癌作用 (这是气功治癌说的支持者们最热衷的说法, 因此我们将之单独列出来)。 1b. 是练气功时具有,但并非气功特有的东西——比如心理暗示——具有治癌作用。 除此之外, 人们或许还可以提出其它可能的解释, 因与本文的讨论无关, 我们不赘述了。 重要的是, 对上述个例的可能解释是不唯一的。 在这种情况下, 仅仅凭借那些个例是无法从各种可能解释中确定或排除掉其中任何一个, 从而也就无法作为支持气功治癌说的论据。 换句话说, 人们通常对气功治癌说的论证方法并不正确。

那么要怎样才能确定气功治癌说是否成立呢? 主要有两种方法: 一种是对那些个例做仔细的医学研究, 以直接确定各种可能解释中究竟哪一种在起作用。 这种方法在目前事实上是无法做到的, 因为目前医学上对自然康复及气功的了解都还很薄弱, 即便对个例做跟踪调查也不可能在这些原因之间做出可靠的判定。 另一种方法则是统计研究, 即首先要对练气功的癌症患者的康复率与普通患者的自然康复率进行比较。 倘若前者高于后者, 且高出的幅度大于合理的统计误差, 则说明气功的确可能具有治癌作用。 但这还不足以说明这种作用是否是气功所特有的, 而不是练气功时具有,但并非气功特有的东西, 比如心理暗示的作用。 即还不足以区分上面提到的可能解释 1a 与 1b。 为了进一步区分这两种情形, 则还需要对练气功的癌症患者的康复率与接受心理暗示实验的普通患者的康复率进行比较。 如果前者高于后者, 且高出的幅度大于合理的统计误差, 则说明气功的确有可能具有某种特有的治癌作用。 这种统计研究据我所知还没有人做过, 但原则上是目前就可以做的, 不象前一种方法那样有赖于医学对自然康复及气功具体机理的深入了解。

有人可能会说, 我虽然没做过统计研究, 但我常常听到练气功的癌症患者康复的消息, 却很少听到练气功的癌症病人死亡的消息, 这难道不是说明练气功的癌症患者康复率非常高吗? 这个问题涉及到了统计样本的客观性问题, 也是统计方法常常被人误用的地方。 答案是: 这并不说明问题。 原因在于人们对象气功治癌之类的事例要远比对练气功后仍然死亡的事例有兴趣, 后者是寻常结果, 无法满足任何人的猎奇心理, 而前者不仅新奇, 而且无形之中给人带来带来一种心理安慰 (谁能保证自己有一天不会患癌症?), 再加上许多气功团体出于自身利益大力宣传这类事例。 因此气功治癌的事例常常受到广泛的传播与记录。 在这种情况下, 人们所能接触的资料本身就有着极大的片面性。 用这些记录来作论证只能得到看似一面倒, 实际上却没有说服力的结论。 需要说明的是, 我上面这些论述并不是在否定气功治癌说。 反驳一种论证并不等同于论证一个相反的结论。 如果要否定气功治癌说, 就必须同样提供统计资料予以论述, 而目前并不存在这样的统计资料。 我上面这些论述的目的在于说明人们通常为气功治癌说所提出的例证是不足以对结论构成有效论证的。 气功治癌说目前还只是一种未经证实的可能性。 真正有说服力的论据必须对未经主观筛选过的样本作研究才能得到。

最后再对统计研究做两点简单评论。 第一点需要明确的是: 通过统计方法确定的是事件之间的统计关联性, 而不是具体机制。 比如说如果对某一年被全世界各大医院诊断为无法治疗的所有癌症病人做跟踪调查, 发现其中不练气功者的自然康复率为 3%, 练习气功者的康复率为 10%, 而样本大到了使统计误差远小于两者之差的程度。 则我们可以说该统计研究表明练习气功与癌症康复之间存在统计关联。 但这并不表示我们已经知道练习气功究竟是如何造成癌症病人康复的。 确定统计关联与确定具体机制是两类不同的研究 (在后者还无法实现的情况下前者往往是最有效的研究手段), 但两者都是科学研究的组成部分, 因为确定统计关联也是对自然现象的一种描述手段。 不能因为统计研究无法确定事件关联的具体机制, 而轻视其价值。 更不能因为常常有人错误理解及使用概率统计手段, 而否认这种手段在科学研究中的有效性。

另外要明确的一点是: 统计方法不是万能的, 它只适用于可以找到足够大样本的情形。 如果个例的发生少到完全无法找到足够大的样本, 则统计方法的确不再适用。 在这种情况下如果我们同时也无法用对个例的直接研究判定其原因的话, 则只能说若干种可能的解释都不能被排除。 但这并不是说当我们提出解释的时候就不再有优劣之分了。 一个好的解释是那种具有普遍性的理论, 即一个除了可以解释这个个例外还可以解释大量其它事例的理论, 这种理论要明显优于仅仅为了解释个例而特别提出的理论。 这是我们在面对奇异现象时首先考虑科学解释的主要原因。

相关链接

站长近期发表的作品

本文的讨论期限已过, 如果您仍想讨论本文,
请在每个月前七天的 “读者周” 期间前来讨论。

>> 查阅目前尚在讨论期限内的文章 <<