欢 迎 访 问 卢 昌 海 个 人 主 页

除了自己的无知,
我什么都不懂。

-苏格拉底

 
信 息
 
 
 
已发表作品列表
站长简介 | 常见问题
版权说明 | 电子信箱
 
统 计
 
 
 
自 2013-08-01 以来
本文点击数
39,590
自 2008-02-01 以来
本站点击数
15,966,129
昨日点击数 6,369
今日点击数 5,471
 
备 注
 
 
 

本文发表于 2013 年 7 月 22 日《北京青年报》的 “锐科技” 栏目。

在大型强子对撞机的幕后

- 卢昌海 -

日内瓦西北郊有一个著名的科学中心——欧洲核子研究组织 (European Organization for Nuclear Research), 简称 CERN。 那里有目前世界上最大的高能粒子加速器——大型强子对撞机 (Large Hadron Collider)。 这个周长 27 公里的庞然大物在过去几年里可谓新闻不断, 比如有人担心它可能会因产生微型黑洞而毁灭地球 (如今还担着这份心的读者可用拙作 黑洞略谈 来宽宽心)。 而它对与 质量的起源 有着密切关系、 被称为 “上帝粒子” (the God particle) 的所谓希格斯粒子 (Higgs) 的寻找更是科学家、 媒体和公众的共同关注焦点。

不过, 相对少为人知的是, CERN 除了科学中心这一身份外, 还是一个重量级的信息技术中心, 尤其是在互联网发展史上起到过很重要的作用。 上世纪 90 年代初, CERN 的计算机科学家伯纳斯-李 (Tim Berners-Lee) 与同事研发出了以超文本 (hypertext) 为基础的网站, 成为互联网上最重要的服务之一——万维网 (World Wide Web)——的发明者, CERN 则成为了万维网的诞生地。 CERN 扮演这一角色不是偶然的。 事实上, 早在万维网诞生之前, 它就已是欧洲最主要的电脑网络枢纽。 而且直至今日, CERN 在互联网领域里依然维持着重要地位。 2008 年, 外界甚至一度传闻 CERN 即将推出新一代的互联网。

那消息很快被证实为是不确实的, 但它也并非空穴来风, 其源头就是大名鼎鼎的大型强子对撞机。 该对撞机的 “日常” 工作就是让大量粒子以极高的能量相互碰撞, 而物理学家们要做的则是通过那些碰撞来探索大自然的奥秘——其中包括寻找希格斯粒子。 但这个简短介绍却忽略了一个极重要的 “幕后” 环节——对数据的处理。

跟老式物理实验中的看仪表读数据、 铺稿纸做计算完全不同, 大型强子对撞机产生的数据是如此之多, 不仅使得肉眼读取和纸笔分析变得不再现实, 就连大型计算机也应付为艰。 更要命的是, 那些数据是以极快的速度源源产生出来的, 从而必须以极快的速度进行采集、 甄别和存储。 除此之外, 物理学家们当然还希望尽可能迅速地分析数据。 这一系列艰巨工作把 CERN 再次推到了信息技术的前沿。

为了以最快的速度处理数据, CERN 建立了目前世界上最大的网格计算系统——全球大型强子对撞机计算网格 (World Wide LHC Computing Grid), 简称 WLCG。 WLCG 的核心部分被称为 “零级中心” (Tier 0)。 该中心与负责采集、 甄别数据的 “计数室” (counting room) 以每秒 100 亿比特 (10 Gb/s) 的超高速光缆相联, 接收甄别后的数据——别小看这甄别, 它是用数以千计的计算机共同进行的, 将来自大型强子对撞机的多达每秒 3,000 亿字节 (300 GB) 以上的数据剔除 99.9% 左右, 从而大大减少后续处理的工作量。 “零级中心” 所获得的数据又通过每秒 100 亿比特的超高速光缆传往北美、 欧洲和亚洲的 11 个 “一级中心” (Tier 1), 而后者则通过普通互联网与分布在世界几十个国家的 150 个 “二级中心” (Tier 2) 相联。 截至 2011 年底, 在这个庞大的网络上已有约 26 万台电脑 (确切地说是 26 万个中央处理器), 总存储空间高达 15 亿亿字节 (150 PB, 约相当于两亿张光盘), 每天处理的数据达几十万亿字节。 当我们在报纸上读到一则有关希格斯粒子的消息时, 也许很少有人会想到过大型强子对撞机幕后那个庞大的计算机网络, 以及为该网络而工作着的数以万计的工程师。 正是他们与科学家们一起, 从浩如烟海的数据之中淘出了有用信息。 也正是有了他们的帮助, 科学家们才可以在几星期甚至更短的时间内将数据变成论文或新闻。

高能粒子在日内瓦郊外的一个小空间内碰撞着, 信息却在散布于全球的几十万台电脑中处理着, 这是所谓 “大科学” 的典型例子。

由于 WLCG 在很多方面与互联网相似, 加上其所采用的新技术所具有的巨大魅力 (比如每秒 100 亿比特的超高速光缆下载一部 DVD 影片只需几秒钟), 以及 CERN 在互联网发展史上的先驱地位, 使得一些人——如前所述——产生了一种历史重演的感觉, 一度将 WLCG 当成了新一代的互联网。 这种感觉在目前还只是错觉, 因为 WLCG 还只是一个专有领域内的东西, 而不是像互联网那样开放的 (起码核心部分还不是)。 但技术本身是跨领域的, 从这个意义上讲, 那错觉未必没有真理的成分。

站长往年同日 (8 月 1 日) 发表的作品

站长近期发表的作品

本文的讨论期限已过, 如果您仍想讨论本文,
请在每个月前七天的 “读者周” 期间前来讨论。

>> 查阅目前尚在讨论期限内的文章 <<