欢 迎 访 问 卢 昌 海 个 人 主 页

除了自己的无知,
我什么都不懂。

-苏格拉底

 
信 息
 
 
 
All English Contents
作品列表 | 电子图书
站长简介 | 常见问题
版权说明 | 电子邮箱
 
统 计
 
 
 
自 2023-03-26 以来
本文点击数
5,882
自 2008-02-01 以来
本站点击数
33,826,017
昨日点击数 2,590
今日点击数 2,124
 
备 注
 
 
 

本文发表于 2023 年 3 月 23 日的《南方周末》。

喜欢本人文字的读者
>>> 欢迎选购本站电子书 <<<

围棋: 人类的反击?

- 发表稿 -

- 卢昌海 -

本文系 “围棋: 人类的反击?” 一文之缩略兼改写, 应《南方周末》约稿而撰。

2023 年 2 月 17 日, 一条新闻来自英国《金融时报》的新闻引起了少数媒体的关注和转载。 那条新闻报道的是: 美国业余六段棋手凯林·佩尔林以压倒性的优势击败了开放源代码围棋程序 KataGo 和 LeelaZero。

换作是在 2015 年之前, 这种消息根本成不了新闻。 因为那时的围棋程序——或广义地讲, 人工智能——本就跟人类棋手差了一大截, 哪怕业余棋手也往往能轻易击败它们。 但时过境迁, 自 2015 年以来, 围棋程序跟人类棋手的实力对比发生了天翻地覆的变化, 其中最令人瞩目的有以下事件:

  • 2015 年 10 月, “深思” 公司的 “阿尔法狗” 以 5:0 的比分击败法籍华裔职业二段棋手樊麾, 成为首个击败人类职业棋手的围棋系统;
  • 2016 年 3 月, “阿尔法狗” 以 4:1 的比分击败曾 14 次荣膺世界冠军的韩国职业九段棋手李世石, 正式攀上了围棋世界的巅峰;
  • 2016 年底, “阿尔法狗” 的优化版本 “阿尔法狗·大师” 在为期数天的一系列网络快棋对决中, 以 60:0 的 “秋风扫落叶” 战绩, “团灭” 了几乎所有人类顶尖棋手 (其中包括中国 “棋圣” 聂卫平、 与李世石并称 “绝代双骄” 的古力, 及当时排名犹在李世石之上的柯洁);
  • 2017 年 5 月, “阿尔法狗·大师” 以 3:0 的比分击败了当时的人类围棋第一高手柯洁。

自此, 人类的围棋步象棋之后尘, 被人工智能踩在了脚下。 但人工智能本身仍在继续发展——而且开始脱离人类的棋谱 “自学成才”:

  • 2017 年 10 月, “自学成才” 的 “阿尔法狗·零” 先是以 100:0 的比分击败 “阿尔法狗”, 后又以 89:11 的比分击败 “阿尔法狗·大师”;
  • 2017 年 12 月, “自学成才” 的 “阿尔法零” 以 60:40 的比分战胜 “阿尔法狗·零”。

我在 “从 ‘深蓝’ 到 ‘深思’” 一文中介绍过那段历史, 感兴趣的读者可参阅。

那段历史的时间跨度虽不过两年多, 水平的差距却以极快的速度变为悬殊乃至鸿沟。 由此带来的结果是: 人类棋手跟人工智能的关系由李世石对阵 “阿尔法狗” 那样的 “人机对抗”, 转变为了用围棋程序训练自己, 以及向围棋程序学习棋艺。

缔造了那段历史的 “阿尔法狗” 系列则 “高处不胜寒”, 如 “独孤求败” 般退隐了, 取而代之的是依据 “阿尔法零” 的设计理念另起炉灶开发出来的一系列开放源代码程序。 KataGo 和 LeelaZero 是那些程序中的佼佼者, 以过往战绩而论都显著超越了人类棋手。

原以为尘埃就此落定, 这就是人类跟人工智能在围棋领域的终极关系了, 却居然出现了佩尔林击败 KataGo 和 LeelaZero 的 “人类的反击”。 这样的 “剧情反转” 无疑是出人意外的, 也因此吸引了一些眼球——其中包括本文作者的眼球。

但尽管吸引了一些眼球, 这场 “人类的反击” 的轰动程度跟昔日 “阿尔法狗” 击败李世石却全然不可同日而语, 只有少数媒体转载, 且除了在一些棋手论坛上稍有后续讨论外, 很快就没了下文, 也很快淡出了公众视野。

很明显, 这场 “人类的反击” 虽不无成就, 却并没有被视为扭转乾坤。

如果说昔日 “阿尔法狗” 击败李世石是 “人类的沦陷”, 标志着人工智能攀上了围棋世界的巅峰; 那么这场 “人类的反击” 为何没有引起对等的轰动, 没被视为扭转乾坤呢?

答案有好几个层面。

首先是: 佩尔林之所以能击败 KataGo 和 LeelaZero, 并不是人类之中横空出世了一位超级棋手, 而是利用了这两个围棋程序里新近被发现的漏洞。 不仅如此, 这漏洞还是通过计算机发现的, 从而本身就来自人工智能。 换句话说, 佩尔林击败 KataGo 和 LeelaZero 的背后, 其实是一种人工智能以特定方式击败了另一种人工智能——有点像当年的 “阿尔法狗·零” 击败 “阿尔法狗”, 或 “阿尔法零” 击败 “阿尔法狗·零” (只不过前者是以特定方式——即利用特定漏洞——击败, 后者则是通过棋力胜出而更普遍地击败)。 这种人工智能之间的相互击败是没什么出奇的, 因为目前的一切围棋程序都远不能穷尽围棋的变化, 不能严格实现理论上的最佳策略, 从而毫无疑问是存在漏洞的。 而漏洞既然存在, 被其他人工智能所发现当然是没什么出奇的。 当然, 此次发现的漏洞有一个特殊之处, 那就是它的原理并不艰深, 从中能衍生出的策略也不涉及复杂计算, 甚至对人类来说有相当的直观性, 故而一经发现, 就连人类棋手也能运用。 这是佩尔林击败 KataGo 和 LeelaZero 的根本原因。 这原因不仅依赖于另一种人工智能, 而且碰巧具有能被人类棋手运用的特殊之处, 这无疑大大削弱了人类的份量, 也大大减弱了这场 “人类的反击” 的轰动性。

其次是——如前所述: 当初击败人类的 “阿尔法狗” 系列已然退隐, 如今被击败的 KataGo 和 LeelaZero 只是依据 “阿尔法零” 的设计理念另起炉灶开发出来的开放源代码程序。 尽管它们的过往战绩也超越了人类棋手, 但击败它们终究不等于报了 “阿尔法狗” 击败人类的 “一箭之仇”, 而更类似于击败了 “仇人” 的徒弟。 这不仅进一步减弱了这场 “人类的反击” 的轰动性, 也不利于将之视为扭转乾坤。

最后——但或许最重要的是: 人工智能的发展速度远远超过人类智能的演化速度——在棋类领域尤其如此, 因此对这场 “人类的反击” 无论怎样拔高, 用稍稍长远点的眼光来看, 都注定是昙花一现的, 不可能真正扭转乾坤。

不过, 这场 “人类的反击” 尽管没有很大的轰动性, 更谈不上扭转乾坤, 在人工智能的发展史上依然是一段有趣的插曲。 事实上, 在人工智能超越了人类的绝大多数领域里, 超越一旦发生, 从人类的角度讲, 就是 “兵败如山倒” 的局面。 像佩尔林击败 KataGo 和 LeelaZero 这样的 “人类的反击” 纵然只是昙花一现, 也是极为罕有的, 值得载入史册。

相关链接

站长往年同日 (3 月 26 日) 发表的作品

站长近期发表的作品

本文的讨论期限已过, 如果您仍想讨论本文,
请在每个月前七天的 “读者周” 期间前来讨论。

>> 查阅目前尚在讨论期限内的文章 <<