围棋：人类的反击？

除了自己的无知，我什么都不懂。－苏格拉底

	信息


All English Contents 作品列表 \| 电子图书站长简介 \| 常见问题版权说明 \| 电子邮箱
	统计


自 2023-03-26 以来本文点击数 6,080 自 2008-02-01 以来本站点击数 34,569,793 昨日点击数 3,266 今日点击数 2,549
	备注


本文发表于 2023 年 3 月 23 日的《南方周末》。

喜欢本人文字的读者
>>> 欢迎选购本站电子书 <<<

围棋：人类的反击？

- 发表稿 -

- 卢昌海 -

本文系 “围棋：人类的反击？” 一文之缩略兼改写，应《南方周末》约稿而撰。

2023 年 2 月 17 日，一条新闻来自英国《金融时报》的新闻引起了少数媒体的关注和转载。那条新闻报道的是：美国业余六段棋手凯林·佩尔林以压倒性的优势击败了开放源代码围棋程序 KataGo 和 LeelaZero。

换作是在 2015 年之前，这种消息根本成不了新闻。因为那时的围棋程序——或广义地讲，人工智能——本就跟人类棋手差了一大截，哪怕业余棋手也往往能轻易击败它们。但时过境迁，自 2015 年以来，围棋程序跟人类棋手的实力对比发生了天翻地覆的变化，其中最令人瞩目的有以下事件：

2015 年 10 月， “深思” 公司的 “阿尔法狗” 以 5:0 的比分击败法籍华裔职业二段棋手樊麾，成为首个击败人类职业棋手的围棋系统；
2016 年 3 月， “阿尔法狗” 以 4:1 的比分击败曾 14 次荣膺世界冠军的韩国职业九段棋手李世石，正式攀上了围棋世界的巅峰；
2016 年底， “阿尔法狗” 的优化版本 “阿尔法狗·大师” 在为期数天的一系列网络快棋对决中，以 60:0 的 “秋风扫落叶” 战绩， “团灭” 了几乎所有人类顶尖棋手 (其中包括中国 “棋圣” 聂卫平、与李世石并称 “绝代双骄” 的古力，及当时排名犹在李世石之上的柯洁)；
2017 年 5 月， “阿尔法狗·大师” 以 3:0 的比分击败了当时的人类围棋第一高手柯洁。

自此，人类的围棋步象棋之后尘，被人工智能踩在了脚下。但人工智能本身仍在继续发展——而且开始脱离人类的棋谱 “自学成才”：

2017 年 10 月， “自学成才” 的 “阿尔法狗·零” 先是以 100:0 的比分击败 “阿尔法狗”，后又以 89:11 的比分击败 “阿尔法狗·大师”；
2017 年 12 月， “自学成才” 的 “阿尔法零” 以 60:40 的比分战胜 “阿尔法狗·零”。

我在 “从 ‘深蓝’ 到 ‘深思’” 一文中介绍过那段历史，感兴趣的读者可参阅。

那段历史的时间跨度虽不过两年多，水平的差距却以极快的速度变为悬殊乃至鸿沟。由此带来的结果是：人类棋手跟人工智能的关系由李世石对阵 “阿尔法狗” 那样的 “人机对抗”，转变为了用围棋程序训练自己，以及向围棋程序学习棋艺。

缔造了那段历史的 “阿尔法狗” 系列则 “高处不胜寒”，如 “独孤求败” 般退隐了，取而代之的是依据 “阿尔法零” 的设计理念另起炉灶开发出来的一系列开放源代码程序。 KataGo 和 LeelaZero 是那些程序中的佼佼者，以过往战绩而论都显著超越了人类棋手。

原以为尘埃就此落定，这就是人类跟人工智能在围棋领域的终极关系了，却居然出现了佩尔林击败 KataGo 和 LeelaZero 的 “人类的反击”。这样的 “剧情反转” 无疑是出人意外的，也因此吸引了一些眼球——其中包括本文作者的眼球。

但尽管吸引了一些眼球，这场 “人类的反击” 的轰动程度跟昔日 “阿尔法狗” 击败李世石却全然不可同日而语，只有少数媒体转载，且除了在一些棋手论坛上稍有后续讨论外，很快就没了下文，也很快淡出了公众视野。

很明显，这场 “人类的反击” 虽不无成就，却并没有被视为扭转乾坤。

如果说昔日 “阿尔法狗” 击败李世石是 “人类的沦陷”，标志着人工智能攀上了围棋世界的巅峰；那么这场 “人类的反击” 为何没有引起对等的轰动，没被视为扭转乾坤呢？

答案有好几个层面。

首先是：佩尔林之所以能击败 KataGo 和 LeelaZero，并不是人类之中横空出世了一位超级棋手，而是利用了这两个围棋程序里新近被发现的漏洞。不仅如此，这漏洞还是通过计算机发现的，从而本身就来自人工智能。换句话说，佩尔林击败 KataGo 和 LeelaZero 的背后，其实是一种人工智能以特定方式击败了另一种人工智能——有点像当年的 “阿尔法狗·零” 击败 “阿尔法狗”，或 “阿尔法零” 击败 “阿尔法狗·零” (只不过前者是以特定方式——即利用特定漏洞——击败，后者则是通过棋力胜出而更普遍地击败)。这种人工智能之间的相互击败是没什么出奇的，因为目前的一切围棋程序都远不能穷尽围棋的变化，不能严格实现理论上的最佳策略，从而毫无疑问是存在漏洞的。而漏洞既然存在，被其他人工智能所发现当然是没什么出奇的。当然，此次发现的漏洞有一个特殊之处，那就是它的原理并不艰深，从中能衍生出的策略也不涉及复杂计算，甚至对人类来说有相当的直观性，故而一经发现，就连人类棋手也能运用。这是佩尔林击败 KataGo 和 LeelaZero 的根本原因。这原因不仅依赖于另一种人工智能，而且碰巧具有能被人类棋手运用的特殊之处，这无疑大大削弱了人类的份量，也大大减弱了这场 “人类的反击” 的轰动性。

其次是——如前所述：当初击败人类的 “阿尔法狗” 系列已然退隐，如今被击败的 KataGo 和 LeelaZero 只是依据 “阿尔法零” 的设计理念另起炉灶开发出来的开放源代码程序。尽管它们的过往战绩也超越了人类棋手，但击败它们终究不等于报了 “阿尔法狗” 击败人类的 “一箭之仇”，而更类似于击败了 “仇人” 的徒弟。这不仅进一步减弱了这场 “人类的反击” 的轰动性，也不利于将之视为扭转乾坤。

最后——但或许最重要的是：人工智能的发展速度远远超过人类智能的演化速度——在棋类领域尤其如此，因此对这场 “人类的反击” 无论怎样拔高，用稍稍长远点的眼光来看，都注定是昙花一现的，不可能真正扭转乾坤。

不过，这场 “人类的反击” 尽管没有很大的轰动性，更谈不上扭转乾坤，在人工智能的发展史上依然是一段有趣的插曲。事实上，在人工智能超越了人类的绝大多数领域里，超越一旦发生，从人类的角度讲，就是 “兵败如山倒” 的局面。像佩尔林击败 KataGo 和 LeelaZero 这样的 “人类的反击” 纵然只是昙花一现，也是极为罕有的，值得载入史册。

2023 年 3 月 17 日完稿
2023 年 3 月 26 日发布
https://www.changhai.org/