EP03：阿基里斯、乌龟和芝诺：人工智能的极限是什么？

Update: 2024-07-14

Description

我们的几个奇怪的主人公终于登场了！一只乌龟、古希腊英雄阿基里斯、芝诺。后面章节中还会出现几个奇怪的角色，包括螃蟹。
这就是GEB著名的招牌结构：在每个章节前，侯世达老师会编一篇对话小故事，把内容引出来。这也是我每一章最爱看的部分，因为相对容易懂。
侯式幽默，虽然有时很冷，但是每个对话都回味无穷，看完这个小故事，带着印象进入下一章，读完后再回来重温一下，方知其奥妙之处。有时会恍然大悟，原来对话中另有玄机；但有时文科生上头，也会想：侯世达老师炫技有点儿过了，让读者觉得智商堪忧可能并不是一件好事。但是，侯世达老师并不care读者智商的承受能力。
上一期留了一个悬念：提到了图灵机——他和哥德尔不完备定理有啥关系？哎别说，那还是很有关系的，不仅有关系，还能带出到底“什么是智能”的一些深层哲学。
本期和大家解读的第一章内容，也是层层嵌套的绝活儿，不仅带出了第二次数学危机，也带出了整个数学大厦、计算机人工智能最重要的基础，地基——形式系统。
大家可以对比一下，听本期播客之前之后，分别能在这一章中找出多少“梗”？
本期剪辑：小碗
本期烧脑提纲：
·(00:06:22 ) 全书和大家见面的第一篇对话是《三部创意曲》。
·(00:09:26 ) 这么一篇奇怪的对话，到底埋了多少梗？为啥叫“三部创意曲”？
·(00:18:26 ) 芝诺禅宗谐音梗，你看出来了吗？
·(00:23:39 ) 什么是形式系统？
·(00:30:22 ) 用国际象棋举个例子
·(00:36:21 ) 侯氏龟能梦电子龟吗？
·(00:42:27 ) MIU还是WJ？
·(00:48:56 ) 机器能“跳出系统”吗？
·(00:56:52 ) 大梗来了
·(01:02:14 ) 哥德尔和图灵机：人工智能的极限是什么？

文字稿和时间戳：
(00:06:22 ) 全书和大家见面的第一篇对话是《三部创意曲》。
对话开始于阿基里斯和乌龟对一面奇特旗子的讨论：
“阿基里斯和一只乌龟站在尘土飞扬的跑道上，烈日当空。在跑道的另一端，有一根高高的旗杆，上面挂着一面长方形的大旗，整面旗子是红色的，但上面有一个环状的狭缝，透过狭缝可以看到天空。这个环形切口呈阿拉伯数字‘零’的形状，这是芝诺最喜欢的数字。”
这么一小段开头，信息密度极大：里面包含了：芝诺悖论，第二次数学危机的内涵——也就是无穷小他到底是不是零？
接着，旗子动了，乌龟和阿基里斯莫名其妙地开始讨论到底是风动还是幡动。（埋梗）
然后芝诺就溜达着路过了，说：“你俩别争了，什么都没动。我发现了一个伟大的定理：运动从本质上说是不可能的。这个定理可以推导出一个更伟大的定理——芝诺定理：运动无有。”
芝诺继续说道：“我的师傅五祖教导我，真如即一，具有不变异性，万象的动迁变化都是感官的幻觉。因此，阿基里斯永远追不上乌龟。”
乌龟点题道：“论证‘运动不可能’的命题是通过芝诺的‘二分悖论’证明的：如果想从A点到B点，必须先走完A到B的一半；要走完这一半，又得先走完这一半的一半。如此无限细分下去，当然永远无法到达B点。”
阿基里斯表示质疑，芝诺说：“不信你就试试。”于是，阿基里斯和乌龟开始了那场著名的赛跑。
(00:09:26 ) 这么一篇奇怪的对话，到底埋了多少梗？为啥叫“三部创意曲”？
GEB这本书可谓是步步埋梗，信息量超大。短短一小段故事就包含了好几个知识点，炫技炫出天际。
"三部创意曲"这个标题本身就是个妙招。它源自卡罗尔的著名文章《乌龟跟阿基里斯说了什么》，侯世达将其视为"二部创意曲"。这里暗藏玄机，因为巴赫恰好有15首二部创意曲，是早期钢琴独奏中两个声部的配合，听起来就像两个人在对话。
侯世达借此给卡罗尔的文章冠名，暗示乌龟和阿基里斯的对话。然后，他更进一步，加入了芝诺，形成了三人对话，于是就有了"三部创意曲"，又恰好对应巴赫的另外15首三声部钢琴独奏曲。这一招既致敬了卡罗尔的故事，又向巴赫的作品致敬，可谓是青出于蓝而胜于蓝。
侯世达又在小对话开篇引用了埃舍尔的莫比乌斯带画作。这一手更高明，因为他在短短几行字里就把"哥德尔（数学）、埃舍尔（艺术）、巴赫（音乐）"这三个领域都巧妙地带出来了。这种炫技手法贯穿全书，读者会不断发现各种梗，有时甚至会觉得有点跑题。但这恰恰体现了侯世达的写作特点——不完全是为读者服务的，更多的是为了自己写得开心，就像我们做播客一样，重要的是自己聊得爽。
从写作风格来看，这本书既不遵循“金字塔原理”，也不遵循“坡道原理”，而是采用了“散文”方式——形散神不散。侯世达东一榔头西一棒槌，到处炫技、到处埋梗，但归根结底还是围绕着GEB、数学、逻辑和人工智能这条主线——讲数学时一定会提到音乐和美术，讲音乐时一定会涉及数学和绘画，讲绘画时也一定会联系数学和音乐。他不关心读者是否能跟上，完全是在抒发自己的感情和想象，想到哪写到哪。每一章都充满了高难度的概念，比如第二章就直接引入了MIU形式系统，对于不熟悉的读者来说可能会感到劝退，但侯世达老师不care。
(00:18:26 ) 芝诺禅宗谐音梗，你看出来了吗？
芝诺悖论，看似在说运动不存在，其实它触及了更深层的数学概念：无穷与有穷、离散与连续、无穷小等等。这些问题属于第二次数学危机的范畴，最终通过微积分和极限的概念得以解决。
更妙的是，卡罗尔在他的文章《乌龟跟阿基里斯说了什么》中，提出了一个更具颠覆性的观点：逻辑本身也存在无穷倒退的状况。这个观点巧妙地将芝诺悖论与自我指代、逻辑循环、怪圈联系起来，进而触及了第三次数学危机的核心——逻辑的困境。
侯世达在书中明显地致敬了卡罗尔。在卡罗尔提出这个观点之前，虽然哥德尔不完全性定理和罗素悖论已经出现，但很少有人将芝诺悖论与第三次数学危机（也就是逻辑问题）联系起来。卡罗尔能有如此独特的视角，实在令人佩服。
我们都知道芝诺悖论讲的是阿基里斯追不上乌龟，看似在讨论运动的可能性。但实际上，它所蕴含的深意远不止于此。侯世达将这个话题称为“三部创意曲”，这个命名本身就很有意思，更重要的是它背后所蕴含的深刻思考。
说到有意思，侯世达还玩了个谐音梗。还记得对话开头，乌龟和阿基里斯莫名其妙地开始讨论“风动还是幡动”吗？
在英文原版中，侯世达故意把“Zeno”（芝诺）和“Zen”（禅）搞混，制造了一个关于芝诺和禅师的笑点。可惜这个梗在中文翻译中无法体现，只有读英文版的读者才能get到他的幽默。
说到翻译，侯世达本人也参与了这本书的深度翻译工作。这本身就是件很有意思的事，尤其是在处理像“Zeno”和“Zen”这种难以直译的文字游戏和双关语时，更显功力。
(00:23:39 ) 什么是形式系统？
第一章名为“WU谜题”。
侯世达没有直接解释什么是形式系统，而是设计了一个名为“WU”的谜题，通过这个谜题让读者尝试解答——最终发现根本无解。通过这个谜题，侯世达试图引出并解释形式系统的概念——GEB全书的中心概念之一。
形式系统到底是什么呢？
核心理念其实很简单：一切都是形式系统（听君一席话，如听一席话式定义）。比如，人类语言就是一种形式系统。语言的语法规则，主语、谓语、宾语的排列组合，都是形式系统的一部分。从语法的角度看，句子的结构不过是符号的排列组合。而这些符号的排列组合如果符合一定的规则，就能产生有意义的语言。
例如，“我打球”是一句符合语法规则的句子，而“我苹果”则不符合，因为两个名词连在一起没有意义。通过语法规则，我们可以禁止不符合规范的组合，从而使语言变得有意义。
如果我们把所有的语法规则列出来，那么语言就变成了符号串的组合方式。同理，计算机语言由0和1的组合构成；音乐由音符和节奏的组合构成；美术作品由像素点的组合构成。这些都是形式系统。
形式系统的根本在于初始元素以及它们的排列规则。无论是语言、计算机代码、音乐还是美术，它们在形式系统的本质上没有区别。形式系统的理念是，世间万物皆为形式系统，一切都是形式系统，这种观点确实具有很大的杀伤力，因为它揭示了万物的本质。
形式系统是一种透过初始元素及其规则来理解世界的方法。而《哥德尔、埃舍尔、巴赫》这本书，正是通过形式系统的视角，带领我们进入一个跨学科的智力盛宴。
(00:30:22 ) 用国际象棋举个例子
世间万物皆为形式系统。乍一听可能觉得难以置信，但仔细想想，确实如此。形式系统就像一个隐藏在事物背后的框架，支撑着事物的运作。就像大楼需要钢架支撑一样，我们日常生活中解决问题的策略、思维模式，甚至复杂的数学体系，都可以看作是形式系统。
形式系统包含三个要素：
·形式语言 (Language): 就像我们说话需要词汇一样，形式系统也需要一套符号和语法规则来表达信息。
·公理 (Axioms): 这是一组被设定为真的基本命题，就像游戏规则一样，是形式系统的基础。
·推理规则 (Rules of Inference): 这是用来从公理推导出其他真命题的规则，就像游戏中的操作规则一样，规定了如何在形式系统中进行推理和演绎。
通过这三个要素，形式系统就能像机器一样运作，产生新的定理(Theorems)，也就是从公理推导出来的真命题。用国际象棋来举例：
·形式语言: 国际象棋的棋盘、棋子、每个棋子的走法等，构成了游戏的语言和词汇表。
·公理: 游戏开始时的初始状态，比如棋子的摆放位置，就是游戏的公理，只有满足这些条件，游戏才能开始。
·推理规则: 棋子的移动规则，比如“马走日”，“象走田”等，就是游戏的推理规则，玩家需要根据这些规则移动棋子。
而游戏的目标“将死对方”，就是一个需要通过推理规则和策略来实现的定理。
上期提到：为什么要把很多过程分解成机械、可重复的形式？其实跟形式系统的本质密切相关。如果我们能把某些行为或事情，用形式系统的方式规范出来，那就更容易让人与人之间达成共识，避免很多不必要的混乱和争论。
(00:36:21 ) 侯氏龟能梦电子龟吗？
为唤起读者的好奇心，侯世达老师给大家贴心地设计了一个小小的谜题：“你能产生WU吗?”。这个谜题如果大家能耐心的读完，并且尝试一下，会发现很妙，很有趣。
我用侯世达同款对话编了一段小故事，可能让大家更容易理解这个”WU谜题”：
这天，阿喀琉斯和乌龟进入了一个名叫”WU迷宫"的迷宫，遇到了一只叫做"meta乌龟"的电子龟。
电子龟塞给了他们一个迷宫引导器，上书两个字母“WJ”。引导器有4条规则：
规则一：如果你有一个以 J结尾的字符串,你可以在它后面再加一个 U。比如 WJ 就可以变成 WJU。
规则二：假设你有 Wx，这里x是任意一个字符串。那么你可以把它变成 Wxx。比如WJU可以变成WJUJU。
规则三：如果你的字符串中有JJJ，你可以用U替换。比如WUJJJU可以变成WUUU。
规则四：如果你的字符串包含UU,你可以把它删除。如WUUU 可以变成 WU。
电子龟问：如果从“WJ”开始，能否通过有限步骤，走出迷宫，得到“WU”？
这就构成了一个典型的形式系统：它有明确的符号(W,J,U)、公理（WJ）和推理规则（规则1-4）。阿喀琉斯和乌龟试图用这些规则去推导WJ，发现他们无论如何都无法从WJ推导出WU，而是不断地陷入"WJ-WJU-WJUJU-WJU-WU-WJ"的循环，无论如何都会陷入循环，都会回到原点WJ。
对此meta-乌龟给出了令人费解的禅宗式回应。它说："WU”。一头雾水，再追问，还是只说"WU”。惜字如金。
乌龟突然一拍脑袋，对阿基利斯说： "WU"在禅宗中代表一种超越二元对立(如是与非、对与错、有与无)的智慧境界，电子龟再暗示我们不要执着于WJ和WU之间的逻辑纠缠，而应该跳出这个系统，用更高的智慧去看待问题啊！
好了这个莫名其妙的故事讲完了。
这个“WU的谜题”到底想说明什么？
(00:42:27 ) MIU还是WJ？
侯世达在介绍形式系统时，首先想传达的是"万物皆形式系统"这一理念。他希望读者明白，形式系统并非高深莫测，也不一定与数学、逻辑学或哲学挂钩。即便是简单如WJU这样仅有三个字母的系统，也是一个典型的形式系统。虽然它无法与人类语言、绘画、音乐或计算机系统相提并论，但麻雀虽小，五脏俱全，完全符合形式系统的基本条件。
这个简单系统的构造颇有意思。有趣的是，英文原版中这个形式系统叫MIU，而中文版则叫WJU。这里面大有文章：
MIU代表Mechanical（机械的）、Intelligent（智能的）和Un-（否定前缀），分别对应机械式推理、人类智能理解和禅宗的"无"概念。这三个概念与形式系统息息相关。
翻译成中文时遇到了挑战，因为对应的中文词汇首字母与英文不同。于是，译者巧妙地创造了新的对应关系：
·J代表"机"，对应机械方式
·W代表"维"（本应为"唯"，但用了"惟"），对应人类智能、逻辑思维
·U仍然代表"无"，对应禅宗思想
这种翻译方式高度重视表意，但也不可避免地留下了一些"bug"。比如，按照逻辑，中文版应该是JWU而非WJU，以对应英文版MIU的顺序。但为了使开头更接近自然语言习惯，最终选择了WJU。
这种精心设计的翻译反映了侯世达对细节的极度重视，甚至到了"机关算尽"的地步。这本书中类似的细节还有很多，就像《红楼梦》一样，值得细细品味。但若要一个一个都挖出来，那根本挖不完。
(00:48:56 ) 机器能“跳出系统”吗？
侯世达通过WJU谜题巧妙地揭示了人类思维与机械逻辑之间的本质差异。这个看似简单的谜题实际上蕴含着深刻的哲学思考：人类思维能否被完全描述为一个形式系统？
谜题的关键在于"跳出系统"的能力。当面对无法解决的问题时，人类可以停下来，审视整个系统，发现规则的本质（如J的数量不会减少），从而得出结论。这种能力正是人类智慧的体现，也是区别于机械逻辑的关键所在。
（这里不得不琢磨，“WU”的读音就是“无”，这不就是在暗示要跳出系统，别钻牛角尖么？）
“跳出系统”：能够跳出正在进行的工作，并且看一下已经做了些什么，是智能固有的特点。比如我读GEB，读不下去的时候，搁在一边儿，把灯关掉。我就“出了GEB系统”。
但教计算机“跳出系统”，能教到什么程度呢？
书里举了一个实例：加拿大一次计算机国际象棋比赛，一个下棋不太强的程序，却有一个很牛的特性：它可以远在棋下完之前早早退出。棋下得不太好，但却有预先估计到没有希望的棋局的能力，然后停下，而不是等着另一个程序把它将死。虽然每次下棋它都输，但是输得很有风度，不丢人。
然而，这个例子其实并不完全贴切。因为程序的认输行为很可能仍然是基于预设的规则（如胜率评估）而非真正的"意识到自己在下棋"。
这引发了更深层次的思考：即使我们不断为计算机添加更高层次的规则，试图模拟人类的各种智能行为，是否有可能最终达到人类思维的灵活性？
人工智能工作的奇异之处：通过一系列严格的形式化规则，教会机器如何表现得灵活。然而，这些规则本身是死板的。但是要涵盖所有智能行为，需要各种不同层次的规则。从基本规则到修改这些基本规则的元规则，再到修改元规则的更高层次规则元元规则，都必须存在。
面对生活中千变万化的情况，我们需要多少层级的规则才能涵盖所有可能性？这些规则的堆叠是否有尽头？
更重要的是，人类"跳出系统"的能力与计算机执行预设规则导致的任务终止是有本质区别的。人类可以意识到自己正在某个系统中运作，并主动选择退出或改变视角。而计算机，无论其行为看起来多么智能，本质上仍然是在执行预设的程序逻辑。
（00:56:52 ) 大梗来了
终极的人工智能不可能论，主要论点在于机器什么时候能认识到自我，才能真正理解自己在一个系统中。这是传统的人工智能理论，而侯世达在他的书中通过一段话揭示了这一点。他写道：
“只有极少数的人有那种眼光看出一个支配许多人生活的系统，而以前却从来没人认为这是一个系统。这些人常就投入毕生的精力去使其他人相信系统确实存在，应该从中退出。”
这段话让你想到什么了吗？
没错，就是《黑客帝国》（The Matrix）。
虽然这部电影是在侯世达的书出版之后拍摄的，但两者的思想有相似之处。可以猜测，《黑客帝国》的导演可能读过侯世达的书，受到了启发。甚至可以推测 “缸中之脑”这个概念，虽然在GEB获得普利策奖之前已经存在，但侯世达可能是第一个系统性提出这一理论的人。
整个GEB都围绕一个核心理念展开，那就是“怪圈”。侯世达认为，人类的自我认知就是一个怪圈，而这个怪圈正是智能的核心。这本书的前两章已经埋下了无数的梗、暗线和隐喻，揭示了这一理念。
哥德尔不完全性定理是一个超级怪圈的典范。哥德尔通过数学方法证明了形式主义和逻辑主义的不成立。然而，哥德尔不完全性定理本身却是形式主义的巅峰之作，它用数字化的方法将形式符号编成数字来进行证明。哥德尔数的概念将形式符号量化，这种方法也可以用于推导其他形式系统，如WU谜题。
(01:02:14 ) 哥德尔和图灵机：人工智能的极限是什么？
图灵机本质上是一个概念性的计算机，它可以被看作是一个典型的形式系统，包含符号、初始状态和生成规则。它虽然简单，但理论上可以模拟任何计算机程序的运行。
哥德尔不完全性定理指出，任何包含基本算术的形式系统都必然存在一些命题，它们是真命题，但在这个系统内部却无法被证明。
那么问题来了：图灵机作为一种形式系统，是否也符合哥德尔不完全性定理？
首先，我们需要明确图灵机是否能够进行基本的数学运算。如果我们假定它可以，那么根据哥德尔不完全性定理，图灵机内部也应该存在一些无法被证明的真命题。
图灵本人提出的“停机问题”似乎印证了这一点。停机问题指的是，是否存在一个程序能够判断任意程序是否会在有限时间内停机。图灵证明了，这样的程序并不存在。
从形式上看，停机问题和哥德尔不完全性定理的表述非常相似。停机问题可以被看作是一个无法判断自身是否停机的程序，这与哥德尔不完全性定理中那个无法证明自身真伪的命题类似。
虽然很多人认为图灵停机问题和哥德尔不完全性定理是等价的，虽然这种说法并不严谨，其中涉及到很多细节问题，但不可否认的是，图灵停机问题确实与哥德尔不完全性定理存在着千丝万缕的联系。
如果我们能制造出图灵完备的计算机系统，是否意味着我们就能创造出人工智能？
对于这个问题，学界存在两种截然不同的观点：一种观点认为，只要计算机系统的规模足够大，就能够模拟人类智能。另一种观点则认为，计算机系统本质上只是一个逻辑系统，而哥德尔不完全性定理已经证明，逻辑系统无法推导出真正的数学或人类智能，更不可能拥有自我意识。
这两种观点的争论一直持续至今，尚无定论。
但无论是哥德尔不完全性定理还是图灵停机问题，都揭示了一个共同点：即使强大如计算机，也存在着无法逾越的“墙”，即“不可计算性”。
正如哥德尔不完全性定理表明，即使在完美的数学大厦中，也存在着逻辑无法触及的角落。图灵停机问题则更进一步，它直接在图灵机这一强大的计算模型中，展示了“不可计算性”的存在。
而人类，作为创造出这些概念的思考者，似乎能够跳出这个“怪圈”，从更高的维度俯瞰这一切。
或许，这正是人工智能与人类智能之间最根本的差异所在。人工智能始终受限于自身的逻辑系统，而人类却能够凭借直觉和意识，超越逻辑的藩篱。

关于《文理两开花》：
《文理两开花》是文科生思维和理科生思维在科技、经济、文化、哲学、货币、数字资产、元宇宙、Web3.0中的碰撞。当下的时代精神是“混沌”，我们试图在混沌中寻找秩序。
Twitter：
@LeiSalin_XP
@Will42W
TG群（开放）：t.me
收听平台：
小宇宙：文理两开花
苹果播客｜Spotify | Google Podcast | 等泛用型平台搜索收听《文理两开花（海外版）》（苹果播客中国区可复制https://open.firstory.me/rss/user/cl0roq