站长在 Bluesky 新开了微博帐号 ▷▷▷ 敬请关注 ◁◁◁
手机版
围棋: 人类的反击?
- 发表稿 -
- 卢昌海 -
2023 年 2 月 17 日, 一条新闻来自英国《金融时报》的新闻引起了少数媒体的关注和转载。
那条新闻报道的是: 美国业余六段棋手凯林·佩尔林以压倒性的优势击败了开放源代码围棋程序 KataGo 和 LeelaZero。
换作是在 2015 年之前, 这种消息根本成不了新闻。 因为那时的围棋程序——或广义地讲,
人工智能——本就跟人类棋手差了一大截, 哪怕业余棋手也往往能轻易击败它们。 但时过境迁, 自 2015 年以来,
围棋程序跟人类棋手的实力对比发生了天翻地覆的变化, 其中最令人瞩目的有以下事件:
- 2015 年 10 月, “深思” 公司的 “阿尔法狗” 以 5:0 的比分击败法籍华裔职业二段棋手樊麾,
成为首个击败人类职业棋手的围棋系统;
- 2016 年 3 月, “阿尔法狗” 以 4:1 的比分击败曾 14 次荣膺世界冠军的韩国职业九段棋手李世石,
正式攀上了围棋世界的巅峰;
- 2016 年底, “阿尔法狗” 的优化版本 “阿尔法狗·大师” 在为期数天的一系列网络快棋对决中, 以 60:0
的 “秋风扫落叶” 战绩, “团灭” 了几乎所有人类顶尖棋手 (其中包括中国 “棋圣” 聂卫平、 与李世石并称
“绝代双骄” 的古力, 及当时排名犹在李世石之上的柯洁);
- 2017 年 5 月, “阿尔法狗·大师” 以 3:0 的比分击败了当时的人类围棋第一高手柯洁。
自此, 人类的围棋步象棋之后尘, 被人工智能踩在了脚下。 但人工智能本身仍在继续发展——而且开始脱离人类的棋谱
“自学成才”:
- 2017 年 10 月, “自学成才” 的 “阿尔法狗·零” 先是以 100:0 的比分击败 “阿尔法狗”, 后又以 89:11
的比分击败 “阿尔法狗·大师”;
- 2017 年 12 月, “自学成才” 的 “阿尔法零” 以 60:40 的比分战胜 “阿尔法狗·零”。
我在 “从 ‘深蓝’ 到 ‘深思’” 一文中介绍过那段历史, 感兴趣的读者可参阅。
那段历史的时间跨度虽不过两年多, 水平的差距却以极快的速度变为悬殊乃至鸿沟。 由此带来的结果是:
人类棋手跟人工智能的关系由李世石对阵 “阿尔法狗” 那样的 “人机对抗”, 转变为了用围棋程序训练自己,
以及向围棋程序学习棋艺。
缔造了那段历史的 “阿尔法狗” 系列则 “高处不胜寒”, 如 “独孤求败” 般退隐了, 取而代之的是依据
“阿尔法零” 的设计理念另起炉灶开发出来的一系列开放源代码程序。 KataGo 和 LeelaZero 是那些程序中的佼佼者,
以过往战绩而论都显著超越了人类棋手。
原以为尘埃就此落定, 这就是人类跟人工智能在围棋领域的终极关系了, 却居然出现了佩尔林击败 KataGo
和 LeelaZero 的 “人类的反击”。 这样的 “剧情反转” 无疑是出人意外的,
也因此吸引了一些眼球——其中包括本文作者的眼球。
但尽管吸引了一些眼球, 这场 “人类的反击” 的轰动程度跟昔日 “阿尔法狗” 击败李世石却全然不可同日而语,
只有少数媒体转载, 且除了在一些棋手论坛上稍有后续讨论外, 很快就没了下文, 也很快淡出了公众视野。
很明显, 这场 “人类的反击” 虽不无成就, 却并没有被视为扭转乾坤。
如果说昔日 “阿尔法狗” 击败李世石是 “人类的沦陷”, 标志着人工智能攀上了围棋世界的巅峰; 那么这场
“人类的反击” 为何没有引起对等的轰动, 没被视为扭转乾坤呢?
答案有好几个层面。
首先是: 佩尔林之所以能击败 KataGo 和 LeelaZero, 并不是人类之中横空出世了一位超级棋手,
而是利用了这两个围棋程序里新近被发现的漏洞。 不仅如此, 这漏洞还是通过计算机发现的,
从而本身就来自人工智能。 换句话说, 佩尔林击败 KataGo 和 LeelaZero 的背后,
其实是一种人工智能以特定方式击败了另一种人工智能——有点像当年的 “阿尔法狗·零” 击败 “阿尔法狗”,
或 “阿尔法零” 击败 “阿尔法狗·零” (只不过前者是以特定方式——即利用特定漏洞——击败,
后者则是通过棋力胜出而更普遍地击败)。 这种人工智能之间的相互击败是没什么出奇的,
因为目前的一切围棋程序都远不能穷尽围棋的变化, 不能严格实现理论上的最佳策略, 从而毫无疑问是存在漏洞的。
而漏洞既然存在, 被其他人工智能所发现当然是没什么出奇的。 当然, 此次发现的漏洞有一个特殊之处,
那就是它的原理并不艰深, 从中能衍生出的策略也不涉及复杂计算, 甚至对人类来说有相当的直观性,
故而一经发现, 就连人类棋手也能运用。 这是佩尔林击败 KataGo 和 LeelaZero 的根本原因。
这原因不仅依赖于另一种人工智能, 而且碰巧具有能被人类棋手运用的特殊之处, 这无疑大大削弱了人类的份量,
也大大减弱了这场 “人类的反击” 的轰动性。
其次是——如前所述: 当初击败人类的 “阿尔法狗” 系列已然退隐, 如今被击败的 KataGo 和 LeelaZero
只是依据 “阿尔法零” 的设计理念另起炉灶开发出来的开放源代码程序。 尽管它们的过往战绩也超越了人类棋手,
但击败它们终究不等于报了 “阿尔法狗” 击败人类的 “一箭之仇”, 而更类似于击败了 “仇人” 的徒弟。
这不仅进一步减弱了这场 “人类的反击” 的轰动性, 也不利于将之视为扭转乾坤。
最后——但或许最重要的是: 人工智能的发展速度远远超过人类智能的演化速度——在棋类领域尤其如此,
因此对这场 “人类的反击” 无论怎样拔高, 用稍稍长远点的眼光来看, 都注定是昙花一现的, 不可能真正扭转乾坤。
不过, 这场 “人类的反击” 尽管没有很大的轰动性, 更谈不上扭转乾坤,
在人工智能的发展史上依然是一段有趣的插曲。 事实上, 在人工智能超越了人类的绝大多数领域里, 超越一旦发生,
从人类的角度讲, 就是 “兵败如山倒” 的局面。 像佩尔林击败 KataGo 和 LeelaZero 这样的 “人类的反击”
纵然只是昙花一现, 也是极为罕有的, 值得载入史册。
2023 年 3 月 17 日完稿 2023 年 3 月 26 日发布 https://www.changhai.org/
本文的讨论期限已过, 如果您仍想讨论本文, 请在每个月前七天的 “读者周” 期间前来讨论。
>> 查阅目前尚在讨论期限内的文章 <<
|