欢 迎 访 问 卢 昌 海 个 人 主 页

除了自己的无知,
我什么都不懂。

-苏格拉底

 
信 息
 
 
 
All English Contents
作品列表 | 电子图书
站长简介 | 常见问题
版权说明 | 电子邮箱
 
统 计
 
 
 
自 2010-02-03 以来
本文点击数
32,728
自 2008-02-01 以来
本站点击数
33,580,683
昨日点击数 5,942
今日点击数 1,210
 
备 注
 
 
 

本文发表于《科学画报》二零一零年第二期 (上海科学技术出版社出版)。

站长在 Bluesky 新开了微博帐号
▷▷▷ 敬请关注 ◁◁◁

信息存储的今天和明天

- 卢昌海 -

本文是应《科学画报》的约稿而写的文章。 本文的发表稿因字数所限, 只包含了 60% 左右的内容, 且除了 [注六] 被并入正文外, 略去了全部注释。

很多朋友大概都用过数码相机。 今天, 你只要花上不到一千元钱就可以买到一台一千万以上像素的小巧玲珑的数码相机。 当你拍摄时, 相片会被自动存储在一张比脚趾甲大不了多少的闪存卡里。 你可以连续拍上一千张相片而不必担心没地方存储。 但你可知道, 仅仅把时间拨回五十年, 如果你想用计算机硬盘来存储这些相片的话, 将会需要一整列火车来替你拉那些硬盘 —— 它们每个重达一吨以上, 却只能存储一张相片。 这个反差的背后, 折射出信息存储技术从昨天到今天的发展。

在西方神学史上流传过一个荒诞的问题, 叫做 “针尖上能有多少个天使跳舞?”, 这个据说来自中世纪 (但并无确凿证据) 的问题现在被用来形容一个课题的陈腐。 但是, 假如我们站在信息存储的角度上, 把它看成一个影像存储的问题, 就一点也不陈腐了。 事实上, 半个世纪以前, 美国物理学家费曼 (R. Feynman) 在一次题为 “There's Plenty of Room at the Bottom” 的有关信息存储的演讲中曾经问过一个类似的问题: 能否把整套大英百科全书写在一个针尖上? 这个问题的背后, 预示着信息存储技术的明天。

一. 今天的信息存储技术 —— 硬盘

众所周知, 文明的发展离不开信息的积累, 而任何东西的积累离不开存储。 因此, 信息存储是文明发展的重要环节, 从某种意义上讲, 甚至可以说是人类迈入文明社会的标志之一。 在历史上, 人类曾经创造过很多信息存储的方法。 而在今天, 随着计算机技术的日益普及, 能被计算机读取的信息存储方法, 即所谓数字化的信息存储, 已变得越来越重要, 甚至连历史最悠久的信息存储方式之一的图书, 也有数字化的趋势。

数字化的信息存储在计算机领域中有一个统称, 叫做外部存储 (external memory —— 简称外存), 以区别于能被计算机的 “大脑” —— 中央处理器 (CPU) —— 直接读取的所谓内部存储 (internal memory —— 简称内存)[注一]。 在今天的计算机中, 内存存储的信息是临时的, 用专业术语来说是易失的 (volatile), 而外存存储的信息则是永久的, 用专业术语来说是非易失的 (non-volatile)。 当然, 这里所谓的 “永久” 不是宇宙学意义上的永久, 而是接近于恋人口中的 “天长地久” 那样的 “永久”。 本文所要介绍的存储技术主要是指外存。

50 年前的硬盘
50 年前的硬盘

在所有外存中, 最重要的也许是硬盘 (hard disk), 它作为计算机的标准配置, 既存储着操作系统与应用软件, 也承担着部分信息存储的任务。 硬盘是今天最成熟的外存技术之一, 它将信息存储在一组磁性介质盘 (platter) 上, 通过精密的磁头 (head) 来进行读写操作。 经过多年的发展, 硬盘的存储能力已达到了万亿字节 (TB) 的量级, 在各种相对快速的存储器件中独占鳌头。 但是, 一个指标上的风光难以遮掩其它方面的窘境, 硬盘有一个很大的缺陷, 那就是在读写数据前必须先将所要读写的区域转到磁头的下方。 当我们启动计算机时, 往往能听到一阵马达的噪音, 那就是硬盘开始转动了。 硬盘的这种工作方式很象我们在餐桌上使用转盘的做法 —— 那是一种很聪明的做法, 在餐桌太大, 菜肴太多时, 它可以很好地解决手不够长的问题。 但它的不便之处也是显而易见的, 那就是速度很慢, 想吃哪个菜得先把它转到自己面前才行。

当然, 计算机硬盘的转动比我们在餐桌上转动菜肴快多了, 现代硬盘的转速通常能达到每秒 120 转, 高端的硬盘甚至能达到每秒 250 转。 别看硬盘很小[注二], 在这样的转速下, 其边缘的运动速度几乎能赶上赛车。 但即便如此, 硬盘作为计算机中硕果仅存的机械部件, 与各种电子部件相比, 仍是一个拖后腿的角色。 而且硬盘的高速转动还带来了很多其它问题, 比如在遭遇震动时极易损坏[注三]。 此外, 硬盘的磁头是利用高速转动产生的气流漂浮在数据盘上方的, 这种气流对温度、 气压、 洁净度等都很敏感, 从而导致普通硬盘的习性十分 “娇气”, 不仅怕冷、 怕热、 怕尘, 而且还恐高 (因为气压随高度而变)。 不仅如此, 如果要开发便携式电子产品, 硬盘的问题就更突出, 因为它的体积太大 (肚子里装着马达呢), 根本就塞不到便携式电子产品中去。

这些缺陷该如何克服呢?

二. 今天的信息存储技术 —— 闪存

要想克服硬盘的缺陷, 很关键的一招就是设法去掉那个 “餐桌上的转盘”, 想吃哪个菜就直接去吃, 别转来转去。 这种直接 “吃菜” 的做法在计算机领域中有一个名称, 叫做随机存取 (random access)。 随机存取并不是什么新概念, 事实上, 计算机的内存就是随机存取的。 但我们在前面说过, 内存所存储的信息是临时的, 而我们想要的是 “天长地久”, 因此需要一类不同的技术。 这类技术中目前用得最普遍的是所谓的固态硬盘 (solid state drive)。 这种技术自二十世纪七八十年代开始开发, 目前已经有了广泛的应用, 其中最重要的一类是采用所谓的闪存 (flash memory) 作为存储介质[注四]

今天的微型 U 盘 (容量比 50 年前的硬盘大几千倍)
今天的微型 U 盘
(容量比 50 年前的硬盘大几千倍)

闪存作为一种信息存储技术出现于二十世纪八十年代初, 由于具有体积小、 能耗低的特点, 如今它已成为从手机到全球卫星定位仪, 从 mp3 播放器到数码相机, 从电子书阅读器到掌上电脑的几乎所有便携式电子产品的标准存储器件。 以闪存为存储介质制作的 U 盘和微型 U 盘不仅可以挂在钥匙扣上, 甚至可以制成特色戒指戴在手指上。 由于不再依赖高速转动, 闪存能有效避免硬盘所具有的传统缺陷。 在一些测试中, 它甚至能经受住诸如用洗衣机洗, 用吉普车压, 用酸液腐蚀, 用干冰冷冻 (请注意是干冰而不是冰) 等极端条件的考验而不丢失数据, 简直比渣滓洞里的党员还顽强。 不仅如此, 闪存所具有的随机存取能力使它能比硬盘更迅速地启动操作系统或应用程序。

闪存具有的优势如此众多, 有人也许会问: 它能否全面取代硬盘呢? 答案在目前还是否定的。 自二十世纪九十年代以来, 闪存在军事、 航天等经常涉及极端环境的领域中已开始起到了取代硬盘的作用。 最近几年来, 一些面向大众的计算机 (尤其是笔记本电脑) 也开始加入了用闪存取代硬盘的行列。 但目前闪存的最大容量与硬盘仍有将近一个数量级的差距, 大容量闪存的价格则比同等容量的硬盘贵得多, 因此闪存距离全面取代硬盘还有一段路要走。 不过这些年闪存技术的发展非常迅速, 甚至比 “摩尔定律” (Moore's Law) 所预言的每 18 个月翻一番还要快, 它在不久的将来带给人们更大的惊喜也并非不可能。

闪存在目前无法全面取代硬盘, 除了容量和性价比方面的原因外, 还有其它一些原因。 比如它在重复写了几千次之后就有可能报废 (高端的闪存可以写到几万或几十万次)。 初看起来几千次似乎也不少, 但别忘了象操作系统这样的软件是随时都在写数据的, 对它来说几千、 几万不算是太大的次数。 此外, 闪存的随机存取能力也是有水分的[注五], 尤其是它的 “写” 与真正的随机存取还有很大差距。 早期的闪存在每次写入数据时必须将全部数据抹掉重写, (那种抹掉全部数据的做法让人想起照相机的闪光灯 —— 闪光过后整张底片一次成像, “闪存” 之名便是由此而来)。 现代闪存虽大有改进, 但在写入数据时仍要 “连坐” —— 一次往往要抹掉几万或几十万字节。 这使得闪存的写入要比读取慢得多 (有 U 盘的读者可以用 U 盘作一个测试来证实这一点), 甚至使得多数闪存产品的速度平均而言并不比硬盘更快 (不过闪存产品的广告通常会用相对较快的读取速度来吸引眼球)。

硬盘和闪存作为今天信息存储技术的代表可以说是互有优劣[注六], 但硬盘由于要借助机械驱动, 发展空间已十分有限, 而象闪存这样的随机存储器件的发展却有很多新思路。 那么, 明天的信息存储技术会是什么样的呢? 让我们到科学家们的 “存储梦工厂” 去参观一些新技术吧。

三. 明天的信息存储技术

“存储梦工厂” 里的新技术可以说是五花八门, 在被它们搞花了眼睛之前, 让我们以最快的速度介绍它们的一个共性。 我们知道, 数字化信息存储的要点是用二进制数码来纪录信息, 因此无论外存还是内存, 它所用的材料必须有两种不同的状态, 以便表示 0 和 1 这两个二进制数码。 比如硬盘所用的铁磁介质有两种不同的磁化状态, 闪存所用的浮闸晶体管 (floating-gate transistor) 有两种不同的导通状态 (即导通和绝缘)。 各种新技术也不例外, 这是它们最大的共性, 而它们的差异则在于实现这种共性的具体方式彼此不同。

“存储梦工厂” 里的新技术很多, 为了让参观有一个合理的线路, 我们可以先想一想: 人们在信息存储技术中到底要追求什么? 显然, 一个很重要的追求指标就是速度, 因此就让我们先参观一种在速度方面有一定长处的技术: 铁电随机存储器 (Ferroelectric RAM —— 简称 FeRAM), 它是二十世纪八十年代后期开始研发的。 这种存储器是用铁电介质的两种不同极化状态来表示 0 和 1。 由于铁电介质的极化可以用很小的外界电压, 以很迅速的方式加以控制, 因此铁电随机存储器的能耗很小, 读写速度则很快, 从理论上讲甚至可以接近内存的速度, 这两项都明显胜过今天的硬盘和闪存。 而它所允许的重复写入次数则远远高于闪存。

不过铁电随机存储器的速度与一种叫做磁阻随机存储器 (Magnetoresistive RAM —— 简称 MRAM) 的新技术相比, 却还不得不俯首称臣。 磁阻随机存储器的研发始于二十世纪九十年代, 所利用的是一种被称为 “隧道磁阻” (tunnel magnetoresistance) 的量子效应。 这种量子效应发生在被一个绝缘薄层分割开的两个磁化层之间, 它使得电子能在两个磁化层之间穿越, 且相应的电阻取决于两个磁化层的相对磁化方向 (方向相同时电阻较小)。 利用这种效应, 我们可以通过控制两个磁化层的相对磁化方向来产生两种不同的电阻状态, 以表示 0 和 1。 磁阻随机存储器的读写速度之高, 不仅在铁电随机存储器之上, 甚至超过了普通的内存。 它的这种惊人的速度优势, 使它有可能代替所谓的高速缓存 (cache)[注七]。 此外, 它的重复写入次数也很高。 在能耗方面它虽不出众, 但也比闪存强, 尤其是写入能耗比闪存低。

这一切看起来很美, 但遗憾的是, 铁电随机存储器和磁阻随机存储器有一个共同的问题, 那就是存储密度远低于硬盘和闪存, 从而难以做大。 目前两者所能达到的最大容量都比闪存小了四个数量级左右[注八]。 在如今这个信息爆炸的时代里, 存储密度也是必须追求的性能, 重要性不亚于速度。 那么, 有没有速度很快, 同时存储密度又很高的新技术呢? 有, 比如相变存储器 (Phase Change Memory —— 简称 PCM 或 PCRAM)。 相变存储器也是用两种不同的电阻状态来表示 0 和 1, 所不同的是这两种电阻状态是来自于特定介质 —— 比如硫系玻璃 (chalcogenide glass) —— 的两个不同的相: 晶体相和无定形 (非晶体) 相[注九]。 相变存储器具有比硬盘和闪存高得多的读写速度, 也具有很高的重复写入次数, 并且 —— 谢天谢地 —— 在理论上可以有极高的存储密度 (虽然目前实际制成的最大容量仍比闪存小两个数量级左右)。 不过, 相变存储器也有一些问题, 其中最大的问题是对温度太敏感, 这是可以预期的, 因为相变是一种对温度很敏感的物理过程。 此外, 相变存储器的能耗较高, 而且它在无定形相下的电阻会随时间缓慢增加, 从而有可能破坏数据的长期稳定。

与上面这些新技术相似的技术还有很多, 比如电阻式随机存储器 (Resistive RAM —— 简称 RRAM)、 纳米存储器 (Nano-RAM —— 简称 NRAM)、 可编程金属化单元 (Programmable Metallization Cell —— 简称 RMC)、 千足虫存储器 (Millipede Memory) 等, 限于篇幅我们就不一一介绍了。 之所以说它们相似, 是因为看上去虽然五花八门, 但它们的信息存储单元基本上都是平面式分布的。 如果我们把那些单元比喻为住人的房子, 那么上述新技术所用的基本上是平房。 我们知道, 平房再怎么先进, 它的居住密度是赶不上楼房的, 那么, 有没有人想到过建楼房呢? 答案是肯定的, 比如近年来美国 IBM 公司就在研发一种三维的存储器, 叫做赛道存储器 (Racetrack Memory)。 它的工作原理是通过象赛道一样的电路将存储信息的磁性单元 “滑行” 到读写探头附近进行读写。 这种设想有别于其它技术的地方就在于 “赛道” 不仅可以在平面上布置, 而且可以象建高楼一样往 “空中” 延伸, 从而获得比硬盘、 闪存以及所有那些其它新技术更高的存储密度。 不过, 有得就有失, 赛道存储器由于要将信息 “滑到” 探头附近才能读写, 因此在速度上要逊色于前面提到的那几种新技术, 只与我们今天使用的硬盘和闪存相当。 当然, 赛道存储器在 “存储梦工厂” 里算是新生儿, 它的速度瓶颈未必是不可突破的。

四. 结语

时间关系, 我们就不在 “存储梦工厂” 里多停留了。 虽然我们参观的主要是外存, 但内外存之间的界限不是绝对的, 也许有一天, 某些具有显著速度优势的新技术会同时取代内存和外存, 成为兼具内外存功能的 “通用存储器” (universal memory)。 若真有那样一天, 计算机的整个设计都有可能被改变。 当费曼讨论 “能否把整套大英百科全书写在一个针尖上” 时, 人们刚刚发明了我们在本文开头提到过的重达一吨的硬盘, 它的截面象圆桌, 体积赛冰箱, 依靠缆线、 滑轮、 步进马达和液压装置来驱动, 容量却只够存储一张相片。 因此费曼在演讲中表示, 他所讨论的是一个原则上有很多事情可做, 实际上却几乎什么都还没做的领域。 半个世纪后的今天, 我们显然已做了很多, 在线度上已经往费曼所说的 “bottom” 方向推进了五个数量级, 但距离 “把整套大英百科全书写在一个针尖上” 的 “费曼目标” 仍有一个数量级之遥。 虽然 “存储梦工厂” 里的那些明天的技术各有各的困难, 但信息存储作为一个年产值数百亿美元的巨大产业, 正在吸引越来越多的研发者, 我们有理由相信, “费曼目标” 已不再遥远。

注释

  1. 外存也叫做次级存储 (secondary storage), 内存也叫做初级存储 (primary storage) 或主存 (main memory)。 此外, 现代计算机的内存还包括所谓的高速缓存 (cache)。
  2. 目前台式电脑的硬盘直径大都为 3.5 英寸 (8.89 厘米), 笔记本电脑的硬盘直径大都为 2.5 英寸 (6.35 厘米)。
  3. 高速转动的硬盘带有很大的角动量, 转轴方向的轻微改变都会使硬盘承受很大的力矩, 从而极易损坏。 由于这一原因, 早期的硬盘在运转时几乎是完全不允许移动的。 不过现代硬盘在这方面已有显著改进, 甚至能自动监测异常移动, 并及时采取保护措施。 但即便如此, 硬盘的抗震能力与闪存等非机械存储器件相比仍很薄弱。
  4. 固态硬盘的另一种重要类型是以计算机内存所用的 DRAM 作为存储介质, 它的速度比普通硬盘及闪存快好几个量级, 但缺点是只在有电源的情况下才能保存数据 (因为 DRAM 是易失型存储介质)。 为了能永久性地保存数据, 使用 DRAM 的固态硬盘需配备独立的内部电源。
  5. 确切地讲, 这里所说的是所谓的 NAND 型闪存。 闪存有两种主要类型, 除 NAND 型外还有一种是 NOR 型。 NOR 型闪存具有更好的随机存取能力, 但价格较贵, 容量较小, 目前基本上只用于手机。 其它闪存产品大都是用 NAND 型。
  6. 这里也顺便提一下今天用得很广泛的另一种信息存储技术 —— 光学存储 (包括 CD、 DVD、 蓝光 DVD 等)。 与硬盘和闪存相比, 光学存储的存储密度 (即单位面积的存储容量) 较低, 比如蓝光 DVD 的存储密度比硬盘和闪存低了 1-2 个数量级 (CD 和 DVD 就更不用说了)。 由于使用机械驱动, 光学存储的读写速度较慢, 驱动器的体积则很大。 而且各种光学存储的碟片都很容易损坏, 甚至一个小小的指印都有可能妨碍数据的存取。 由于这些缺点, 光学存储的主要功能与其说是信息存储, 不如说是特定产品 (比如音乐、 影视、 软件) 的发布工具, 而且即便在产品发布方面, 它也有被其它技术 —— 比如网络下载 —— 取代的可能。
  7. 高速缓存是一种速度比内存还要快得多的易失型存储器。 与之相比, 磁阻随机存储器的速度虽快, 却仍有不及, 不过它的速度虽有所不及, 容量却比高速缓存大, 从而有可能通过容量弥补速度的不足。
  8. 由德、 法两国科学家在 1988 年所发现 (并获得 2007 年诺贝尔物理学奖) 的巨磁阻 (giant magnetoresistance) 效应有可能为解决磁阻随机存储器的存储密度问题提供帮助, 不过这方面目前尚无具体成果。
  9. 硫系玻璃这样的介质自二十世纪六十年代以来就有人在研究, 我们熟悉的重复可写光盘 (CD-RW 或 DVD-RW) 所用的就是这样的介质, 只不过可写光盘利用的是这种介质的光学反射性质, 而相变存储器利用的是它的电阻性质。

相关链接

站长近期发表的作品

网友讨论选录

  • 网友: 星空浩淼   (发表于 2010-02-03)

    好文章, 虽然我是工科出身的, 仍然感觉很长见识, 许多内容都是从此文中第一次获知。

  • 网友: 往事如昨   (发表于 2010-02-03)

    CD/DVD 一类的存储介质有两个重要的特性——价格极低, 可极大量的生产; 比较容易携带 (这个特性现在已让位于 U 盘了)。 尤其是可以极大批量的生产这一点, 是其它存储手段目前难以做到的。

  • 卢昌海   (发表于 2010-02-03)

    有道理。 光盘便携性虽然逊于 U 盘, 但单位 GB 的价格便宜; 硬盘单位 GB 的价格虽然也便宜, 但不如光盘便于携带 (除非要携带非常大量的数据)。

  • 网友: 星空浩淼   (发表于 2010-02-03)

    可以把家庭的录像或者照片刻入光盘永久保存, 但是人们似乎还不敢用 U 盘来完成这个任务。 U 盘容易坏, 国内的一些 U 盘, 有的买回来没用几回就坏了, 让你抓狂。

  • 卢昌海   (发表于 2010-02-04)

    其实光盘 (尤其是可写光盘) 的寿命是很有限的 (5-10 年后就堪忧), 且容易被外力所损坏, 并不适合于保存家庭的录像或照片, 建议星空兄用移动硬盘来存储。 U 盘如果不经常写数据的话, 寿命恐怕还是可以的。 不过国内的假 U 盘的确是大麻烦。 往某些假 U 盘中存照片的话, 一旦超过该盘的实际容量 (有时低到只有 128 MB), 新存入的照片就会覆盖旧照片, 造成惨重的损失……

  • 网友: 一醉   (发表于 2010-02-04)

    不会覆盖原来的文件, 我同事买过这种盘。 超过了容量以后就写错误了, 不能写入, 可以当做一个小 U 盘用……

  • 卢昌海   (发表于 2010-02-04)

    一醉网友提到的会出错的也是一种假盘, 但最牛的是那种不出错的 (危害也更大, 因为会让人不知不觉地覆盖自己的数据, 正所谓 “咬人的狗不叫”)。

  • 网友: Atommann   (发表于 2010-02-04)

    文章的内容很赞, 读起来很舒服, 把硬盘访问数据用转桌 “吃菜” 来类比, 太形象了, 看了就忘不了。:)

  • 来自 218.82 的游客   (发表于 2010-02-04)

    “这里所谓的 ‘永久’ 不是宇宙学意义上的永久, 而是接近于恋人口中的 ‘天长地久’ 那样的 ‘永久’。”——作者是爱情愤青。

  • 卢昌海   (发表于 2010-02-05)

    呵呵, 俺不是爱情愤青, 这个比喻其实是精心安排的。 文章介绍的那些信息存储技术在正常情况下也就能保存数据几十或上百年, 跟真挚爱情的时间 (即两人的生命长度) 差不多, 如果运气坏或有偶然因素作祟的话, 保存时间会大大缩短, 跟不真挚的爱情差不多。 唯一被我忽略的是真挚爱情在两人死后对别人的精神鼓励作用, 但这应该算不上愤青行为吧。:-)

  • 网友: henring   (发表于 2010-02-06)

    如果不经常读盘, CD/DVD 盘会不会保存得更长的时间?

  • 卢昌海   (发表于 2010-02-06)

    光盘的保存比较讲究温度、 湿度的控制, 另外紫外线也会造成光盘材料的蜕化。 理论上很多生产商宣称的寿命都在几十年以上 (假货不算), 但实际上专家们的意见很不一致, 最悲观的是认为只能保证 3-5 年。 如果是很重要的东西, 最好是保留不止一个备份, 且每隔几年就检查一下, 或干脆用硬盘。 硬盘除了不便于携带外, 其它方面也是不错的。 如果数据量大的话, 硬盘其实也不贵, 而且在一个硬盘上查找数据要比在一大批光盘上查找数据方便得多。 不过, 可写光盘 (CD-R) 有一个好处倒是普通 U 盘及硬盘无法提供的, 那就是写完后就变成 read-only。 这使得你即使在有病毒的机器上读数据, 也不必担心数据本身的安全。 因此重要的数据我一般也定期做一个光盘备份。

本文的讨论期限已过, 如果您仍想讨论本文,
请在每个月前七天的 “读者周” 期间前来讨论。

>> 查阅目前尚在讨论期限内的文章 <<