欢 迎 访 问 卢 昌 海 个 人 主 页

除了自己的无知,
我什么都不懂。

-苏格拉底

 
信 息
 
 
 
All English Contents
作品列表 | 电子图书
站长简介 | 常见问题
版权说明 | 电子邮箱
 
统 计
 
 
 
自 2022-04-12 以来
本文点击数
6,338
自 2008-02-01 以来
本站点击数
33,580,185
昨日点击数 5,942
今日点击数 712

站长在 Bluesky 新开了微博帐号
▷▷▷ 敬请关注 ◁◁◁

从“αβγ”到“超署名”

- 卢昌海 -

近日翻看一本闲置多年的杂书: A Random Walk in Science (《科学中的随机游走》)。 此书汇集了许多关于科学的趣味、 幽默乃至搞笑的文章或文章片段, 长则数页, 短者三言两语。

其中一篇 “三言两语” 的 “吐槽” 让我会心而笑。

那篇 “吐槽” 来自 1964 年 11 月的 Physics Today (《今日物理》) 杂志, 是一封 “读者来信”, 针对的是高能物理论文的作者阵容太过庞大, 具体文字如下[注一]

高能物理学家们又向我们展示了一篇作者数 (27) 比段落数 (12) 还多的论文。 高能物理果真可以如此另类吗?

时隔半个多世纪重读这篇 “吐槽”, 作者之问——“高能物理果真可以如此另类吗?”——早已有了不言而喻的肯定答案, 唯一可以勘正的, 是 “另类” 二字已然落伍。 因为半个多世纪后的今天, 作者数比段落数还多的论文早已不是高能物理的 “专利”, 与其说是 “另类”, 不如说已成为了 “新常态” (new normal)。 至于 “吐槽” 针对的区区 27 的作者数, 在今天看来, 则早已微不足道——比如在我撰文介绍过的引力波天文学领域里, 就已有过关于黑洞双星合并的作者数约 1,000 的论文 (2016 年), 及关于中子星双星合并的作者数约 3,600 的论文 (2017 年)。

作者数约 3,600 是个什么概念? 本文碍于篇幅, 无法进行文字再现, 但有人针对一篇作者数约 3,500 的高能物理论文制作过一幅有趣的 “微缩” 图片 (右图)[注二], 可做直观参考。

这样庞大的作者阵容恐怕是 1964 年的 “吐槽” 者做梦也想不到的, 但它仍不是最庞大的, 因为 2015 年的一篇发表在《物理评论快讯》 (Physical Review Letters) 上的高能物理论文的作者数达到了更惊人的 5,154, 单纯因作者阵容的庞大就一度引起了媒体关注[注三]

所谓 “冰冻三尺, 非一日之寒”。 这种庞大的作者阵容并非从天而降, 而是有历史沿革的, 学界对此的反应也是有一个演进过程的。 本文开篇引述的 “吐槽” 乃是这种反应的早期例子。 之后的反应则渐渐由 “吐槽” 转为了思考。 2001 年, 美国印第安纳大学 (Indiana University) 的信息学教授布莱斯·克罗宁 (Blaise Cronin) 将思考推向了一个系统层面, 在 The Journal of the Association for Information Science and Technology (《美国信息科技协会会刊》, 简称 JASIST) 上发表论文[注四], 回顾了 “署名” 这一行为的历史, 并提出了 “超署名” (hyperauthorship) 这一概念, 用来表示作者数超过 100 的大规模署名现象。

克罗宁提到, 从 1981 年到 1994 年, “超署名” 论文的数目从 1 增加到了 182。

如今距离克罗宁的论文又过了 20 多年, 克罗宁定下的作者数 100 这一门槛已显得偏低, 不过 “超署名” 这一概念作为大规模署名现象的唯一 “学名” 还是沿用了下来。 继克罗宁的论文之后, 2012 年, 科学观察网站 (ScienceWatch.com) 发布的一项新研究显示, “超署名” 论文的数量有了新的爆炸式增长: 1998 年为 400 多, 2010 年超过了 1,000。 比 “超署名” 门槛高一个数量级——即作者数超过 1,000——的论文的数量, 在 2010 年之前只是偶尔破零, 2010 年变成 17, 2011 年更是增加到 140。 比那更新, 2019 年, Nature (《自然》) 杂志也发布了一项研究, 显示从 2009 到 2013 这 5 年间, 作者数超过 1,000 的论文总数为 573, 从 2014 到 2018 这随后的 5 年间, 该数目攀升到了 1,315。

这些研究表明, “超署名” 论文并非凤毛麟角, 其存在也绝非偶然, 而是一种持续增长着的系统性的现象。 这种现象究竟缘何会出现呢? 一个根本原因是所谓 “大科学” (Big Science) 的兴起——即科学研究越来越依赖技术上复杂而庞大的设备。 而 “大科学” 的兴起本身也不是偶然的, 比如量子力学的规律意味着探测小尺度要用大加速器, 引力的微弱意味着探测引力波要用大干涉仪, 地球大气层的存在意味着精密天文探测要到外太空去进行, 等等。 所有这些都导向了 “大科学”。 因此, 以物理领域为例, 美国物理学家史蒂文·温伯格 (Steven Weinberg) 曾这样概括 “大科学” 的出现: “发现的逻辑迫使物理学变大” (the logic of discovery forced physics to become big)[注五]

“大科学” 的 “大” 是全方位的, 除资金和设备外, 人员规模也是史无前例的大, 构成了若干极其庞大的群落。 “超署名” 体现的正是后者。 仍以物理领域为例, 据统计, 目前规模最大的几个论文 “超署名” 群落及约略人数为:

  1. 紧凑 μ 子螺线管探测器 (Compact Muon Solenoid Detector, 简称 CMS): 4,000 人;
  2. 超导环场探测器 (A Toroidal LHC ApparatuS, 简称 ATLAS): 3,000 人;
  3. 线性对撞机协作 (Linear Collider Collaboration, 简称 LCC): 2,000 人;
  4. 大型离子对撞机实验 (A Large Ion Collider Experiment, 简称 ALICE): 1,500 人;
  5. 深地下中微子实验 (Deep Underground Neutrino Experiment, 简称 DUNE): 1,000 人;
  6. LIGO 科学协作 (LIGO Scientific Collaboration, 简称 LSC): 1,000 人。

这些群落每一个的规模都在千人以上, 且大都仍在扩张 (故以上所列人数皆为 “下限”)。 正是它们的存在, “保障” 了作者数超过 1,000 的 “超署名” 论文并非凤毛麟角, 也绝非偶然, 而是系统性的, 且会持续增长。

另一方面, 虽然 “超署名” 群落的人员规模已如此庞大, 但有时候, 甚至那样的规模仍不足以 “单干”, 而需跟其他 “超署名” 群落合作。 一旦出现那样的情形, 群落的作者当然也就合并了。 这种合并有可能成为一个 “见证奇迹” 的时刻, 打破——甚至大幅打破——作者数的 “世界纪录”。 比如上文提到的作者数为 5,154 的论文便是如此, 它是 ATLAS 和 CMS 合作的结果, 且缔造了新的 “世界纪录”[注六]

从 “超署名” 的出现缘由中不难预期, 那样的 “世界纪录” 几乎注定会被持续打破。

与 “超署名” 背后的 “大科学” 相对应的, 是之前的 “小科学”。 “小科学” 时代的论文没有成百上千的作者, 也没什么作者数上的 “世界纪录” 可言, 却并不缺乏署名方面的故事——而且是有趣得多的故事。 作为对 “署名” 这一行为的 “小科学” 时代的对比回顾, 我们来介绍那样一个故事, 涉及的是一篇被称为 “αβγ” 论文的著名论文。

所谓 “αβγ” 论文, 它的正式标题是 “化学元素的起源” (The Origin of Chemical Elements), 发表年份是 1948 年。 那篇论文是宇宙学历史上的重要论文, 被有些物理学家视为大爆炸宇宙论的奠基性论文之一, 也是宇宙学往精密科学方向发展的源头之一。 那篇论文的作者是俄裔美国物理学家乔治·伽莫夫 (George Gamow) 和他的研究生拉尔夫·阿尔菲 (Ralph Alpher)。 由于 “阿尔菲” (Alpher) 和 “伽莫夫” (Gamow) 的发音很接近希腊字母 “α” 和 “γ”, 因此极富幽默感的伽莫夫决定在署名上搞点花样, “擅自” 将姓氏发音恰好很接近希腊字母 “β” 的德裔美国物理学家汉斯·贝特 (Hans Bethe) 添到了作者行列里, 以便凑成 “αβγ”。

“αβγ” 论文是伽莫夫对物理学界乃至对世界所开的无数玩笑中的一个, 也是令人怀念的 “小科学” 时代的署名趣事。 那样的趣事在 “超署名” 论文里是不会有的。 在后者那 “乌泱泱” 的作者阵容里, 哪怕有几个人的名字可以凑成某种有趣组合, 也根本不会有人在意——同时根本也不值得在意, 因为那是大样本的必然结果, 毫无趣味可言。 “超署名” 论文里的普通作者几乎是 “民工” 型的——全都没了固然不行, 但少掉或换掉十个八个, 甚至几十几百个都不会对论文产生实质影响。

“超署名” 论文的这一作者如 “民工” 的特点不仅显著有别于 “小科学” 时代, 而且引起了一些疑虑。 如果说本文开篇引述的那种 “吐槽” 还带着幽默意味, 那么时隔半个多世纪的今天, 对 “超署名” 论文的疑虑就有一定的严肃性了。 这是因为, 人们对论文的署名是有些基本要求的, 比如国际医学杂志编辑委员会 (International Committee of Medical Journal Editors, 简称 ICMJE) 对论文的署名作过界定, 要求在论文上署名的作者满足以下条件[注七]

  • 对概念或设计, 或对数据的获取、 分析、 诠释有显著贡献;
  • 参与论文起草, 或对论文的主要内容作过勘正;
  • 对发表稿作过终审;
  • 同意对研究工作的所有方面负责。

该界定并且强调, 上述条件必须同时得到满足。 美国国家科学院 (National Academy of Sciences, 简称 NAS) 对院刊论文的署名也有虽没那么细致但主旨类似的界定, 要求 “署名应限于对研究工作有过显著贡献的人”。 这样的基本要求在 “小科学” 时代是很容易做到, 而且不难核实的。 事实上, 就连在 “αβγ” 论文那样为幽默而拿署名开了玩笑的个例中, 被 “擅自” 添到作者行列里的贝塔也是在认真审阅了论文内容之后才正式同意署名的, 而且据伽莫夫说, 贝塔还参与了后续讨论, 从而基本上仍满足上述所有条件。 但在某些 “超署名” 论文里, 作者数甚至比论文里的单词数 (或中文的字数) 还多, 且大比例是 “民工” 型的, 想让每位作者都满足上述条件就不可能了。

“超署名” 的另一个特点是, 由于作者阵容过于庞大, 哪怕在论文成稿的短时间内, 有时就会有一定数目的作者去世, 从而以往通常只在出版周期较长的图书或丛书的作者或编委名单中才会出现的 “打框” 的名字——即已故者的名字, 在 “超署名” 论文中也并不罕见了。 比如在 2012 年宣布发现希格斯粒子 (Higgs boson) 的作者数约 3,000 的 “超署名” 论文中, 就出现了 21 位已故者[注八]

“超署名” 论文出现至今虽还不到半个世纪, 跟科学论文本身的历史相比还很短暂, 但在物理、 天文、 生物、 医学等领域都已成为显著现象, 若干其他领域也有跟进之势。 助长这种显著性的, 是 “超署名” 论文因作者众多, 被引用——尤其 “自引”——的可能性大大高于普通论文, 从而在素来倚重引用数的各种论文排序中往往名列前茅。 在这股潮流里, 一片难得的 “净土” 是数学——因为数学对经费的需求, 对设备的依赖都小得多, 从而起码到目前为止并无步 “大科学” 后尘之迹象[注九]

在结束本文前, 我们就拿数学这片 “净土” 里的一件趣事来最后反衬一下 “超署名” 吧。

数学爱好者们也许知道一位名叫保罗·埃尔德什 (Paul Erdős) 的数学家, 他是以高产, 及合作者众多著称的数学家, 一生发表过 1,500 多篇论文, 跟超过 500 位数学家合发过论文, 是 “小科学” 时代的一个传奇。 为纪念埃尔德什, 也为了凸显埃尔德什合作者众多这一特点, 数学家们创造了一个概念: 埃尔德什数 (Erdős number), 用来表示一位数学家跟埃尔德什在论文合作上的 “距离”。 具体来说, 埃尔德什本人的埃尔德什数是 0, 跟埃尔德什合发过论文的数学家的埃尔德什数是 1, 没跟埃尔德什合发过论文, 但跟某位埃尔德什数为 1 的数学家合发过论文的数学家的埃尔德什数是 2, 依此类推。 但在某些 “超署名” 论文里, 任何一位 “民工” 型作者的 “合作者” (其中多数根本就互不认识) 的数目都远远超过了埃尔德什在传奇一生中的合作者总数, 类似创造 “埃尔德什数” 这样的趣事也就因彻底糟践而变得毫无意义了。

从 “αβγ” 到 “超署名”, 是一个特定层面传奇褪色的过程。 这种褪色对亲身经历过 “小科学” 时代的人是会有些不适应的。 比如 “αβγ” 中的 “β” (贝塔) 眼里的 “小科学” 时代是这样的: 所有的发现都是用不太大也不太贵的设备作出的; 所有国家的物理学家都彼此相识; 哥本哈根和哥廷根的生活如田园般悠闲, 却几乎每天都有新发现…… 而 “大科学” 时代给他的印象则是: 有了巨大的加速器, 每个都要一大群科学家; 论文多到了紧跟一个小领域都不再可能; 每年很多次地跨越大洲大洋参加连朋友都找不着的巨无霸会议, 基础性发现的步伐却反而变慢了……

“怎么一切都变了啊!” 贝特如是感慨。 我读贝特的感慨本身也很感慨, 因为他的感慨发表于 1958 年, 所提到的 “巨大的加速器”, “一大群科学家”, “巨无霸会议” 等等跟今天的 “大科学” 相比完全是 “小巫见大巫” 啊!

注释

  1. 这位 “吐槽” 者名叫 Robert Myers, 所针对的论文为 F. Bulos et al, Total Cross Sections and Angular Distributions for π + p → η0 + n from Threshold to 1151 MeV, Phys. Rev. Lett. 13, 486 (1964)。
  2. 对本文虽无重要性, 但为完备起见, 还是列一下: 该论文为 G. Aad. et al, Charged-particle multiplicities in pp interactions at sqrt(s) = 900 GeV measured with the ATLAS detector at the LHC, Phys. Lett. B 688, 21-42 (2010)。
  3. 同样, 对本文虽无重要性, 还是列一下: 该论文为 G. Aad. et al, Combined Measurement of the Higgs Boson Mass in pp Collisions at sqrt(s) = 7 and 8 TeV with the ATLAS and CMS Experiments, Phys. Rev. Lett. 114, 191803 (2015)。
  4. 该论文为 B. Cronin, Hyperauthorship: A Postmodern Perversion of Evidence of a Structure Shift in Scholarly Communication Practices?, JASIST 52, 558-569 (2001)。
  5. 既是 “发现的逻辑” 所 “迫使”, 便是必由之路, 因此请勿将本文看成是对 “大科学” 的批评。 “大科学” 自有其激动人心之处, 我在很多其他文字里也详细写过。 本文只是单纯闲话 “署名” 这一环节——尤其是 “超署名” 的特点 (虽 “碰巧” 不是优点)。
  6. 细心的读者也许会发现, ATLAS 和 CMS 的人数之和明显超过 5,154, 这个简单 “矛盾” 就留作思考吧。:-)
  7. 本文的素材多来自物理领域, 对署名条件的界定照说也该以物理领域为例, 但试找了几份物理刊物, 却皆未见到明确界定, 故只得以其他领域为例了。 好在那些条件 (表述上略有精简) 跟学科基本无关, 且多为常识 (物理刊物之未作明确界定, 大约也是视其为常识之故吧), 当不失代表性。
  8. 该论文为 G. Aad. et al, Observation of a new boson at a mass of 125 GeV with the CMS experiment at the LHC, Phys. Lett. B 716, 1-29 (2012)。——这位 “G. Aad” 在本文的注释里已三度出现, 托字母排序之福, 简直是永恒的 “第一作者” (同时也可看到, 在 “超署名” 论文里当第一作者是何等 “不易”——在 [注一] 提到的因作者数太多而遭 “吐槽” 的论文里, 第一作者的姓氏首字母仅仅是 “B”, 而在今天的 “超署名” 论文里, 不仅首字母必须是 “A”, 连第二字母也得是 “a” 了)。
  9. 熟悉我的读者也许知道, 在我的多数文字里, 谈到科学时, 对数学与科学是不强作分割的。 我在 “尺规作图三大问题的早期历史” 一文的 [注一] 中, 曾就这一点做过简短说明, 可参阅。

站长往年同日 (4 月 12 日) 发表的作品

站长近期发表的作品

网友讨论选录

  • 网友: tjlaoji   (发表于 2022-04-12)

    非常怀念小科学时代, 那真是科学的田园牧歌时代啊, 我们小时候 (我是 70 后) 眼里的科学就是那样的: 牛顿坐在苹果树下灵机一动就发现了万有引力, 陈景润在斗室里做出震惊世界的发现, 如此等等, 却不知道当时已经是大科学时代了。 而且, 这种情况看来不会逆转了。

  • 卢昌海   (发表于 2022-04-12)

    情况不会逆转, 不过应该会两者并存, “小科学” 模式的研究——尤其是理论研究——应该仍会长期存在。 温伯格在一次报告中谈到这种 “超署名” (当然, 他没有用这一称谓) 现象时说, 他每天都庆幸自己是做理论的。:-)

本文的讨论期限已过, 如果您仍想讨论本文,
请在每个月前七天的 “读者周” 期间前来讨论。

>> 查阅目前尚在讨论期限内的文章 <<