EP03:阿基里斯、乌龟和芝诺:人工智能的极限是什么?
Description
我们的几个奇怪的主人公终于登场了!一只乌龟、古希腊英雄阿基里斯、芝诺。后面章节中还会出现几个奇怪的角色,包括螃蟹。
这就是GEB著名的招牌结构:在每个章节前,侯世达老师会编一篇对话小故事,把内容引出来。这也是我每一章最爱看的部分,因为相对容易懂。
侯式幽默,虽然有时很冷,但是每个对话都回味无穷,看完这个小故事,带着印象进入下一章,读完后再回来重温一下,方知其奥妙之处。有时会恍然大悟,原来对话中另有玄机;但有时文科生上头,也会想:侯世达老师炫技有点儿过了,让读者觉得智商堪忧可能并不是一件好事。但是,侯世达老师并不care读者智商的承受能力。
上一期留了一个悬念:提到了图灵机——他和哥德尔不完备定理有啥关系?哎别说,那还是很有关系的,不仅有关系,还能带出到底“什么是智能”的一些深层哲学。
本期和大家解读的第一章内容,也是层层嵌套的绝活儿,不仅带出了第二次数学危机,也带出了整个数学大厦、计算机人工智能最重要的基础,地基——形式系统。
大家可以对比一下,听本期播客之前之后,分别能在这一章中找出多少“梗”?
本期剪辑:小碗
本期烧脑提纲:
·(00:06:22 ) 全书和大家见面的第一篇对话是《三部创意曲》。
·(00:09:26 ) 这么一篇奇怪的对话,到底埋了多少梗?为啥叫“三部创意曲”?
·(00:18:26 ) 芝诺禅宗谐音梗,你看出来了吗?
·(00:23:39 ) 什么是形式系统?
·(00:30:22 ) 用国际象棋举个例子
·(00:36:21 ) 侯氏龟能梦电子龟吗?
·(00:42:27 ) MIU还是WJ?
·(00:48:56 ) 机器能“跳出系统”吗?
·(00:56:52 ) 大梗来了
·(01:02:14 ) 哥德尔和图灵机:人工智能的极限是什么?
文字稿和时间戳:
(00:06:22 ) 全书和大家见面的第一篇对话是《三部创意曲》。
对话开始于阿基里斯和乌龟对一面奇特旗子的讨论:
“阿基里斯和一只乌龟站在尘土飞扬的跑道上,烈日当空。在跑道的另一端,有一根高高的旗杆,上面挂着一面长方形的大旗,整面旗子是红色的,但上面有一个环状的狭缝,透过狭缝可以看到天空。这个环形切口呈阿拉伯数字‘零’的形状,这是芝诺最喜欢的数字。”
这么一小段开头,信息密度极大:里面包含了:芝诺悖论,第二次数学危机的内涵——也就是无穷小他到底是不是零?
接着,旗子动了,乌龟和阿基里斯莫名其妙地开始讨论到底是风动还是幡动。(埋梗)
然后芝诺就溜达着路过了,说:“你俩别争了,什么都没动。我发现了一个伟大的定理:运动从本质上说是不可能的。这个定理可以推导出一个更伟大的定理——芝诺定理:运动无有。”
芝诺继续说道:“我的师傅五祖教导我,真如即一,具有不变异性,万象的动迁变化都是感官的幻觉。因此,阿基里斯永远追不上乌龟。”
乌龟点题道:“论证‘运动不可能’的命题是通过芝诺的‘二分悖论’证明的:如果想从A点到B点,必须先走完A到B的一半;要走完这一半,又得先走完这一半的一半。如此无限细分下去,当然永远无法到达B点。”
阿基里斯表示质疑,芝诺说:“不信你就试试。”于是,阿基里斯和乌龟开始了那场著名的赛跑。
(00:09:26 ) 这么一篇奇怪的对话,到底埋了多少梗?为啥叫“三部创意曲”?
GEB这本书可谓是步步埋梗,信息量超大。短短一小段故事就包含了好几个知识点,炫技炫出天际。
"三部创意曲"这个标题本身就是个妙招。它源自卡罗尔的著名文章《乌龟跟阿基里斯说了什么》,侯世达将其视为"二部创意曲"。这里暗藏玄机,因为巴赫恰好有15首二部创意曲,是早期钢琴独奏中两个声部的配合,听起来就像两个人在对话。
侯世达借此给卡罗尔的文章冠名,暗示乌龟和阿基里斯的对话。然后,他更进一步,加入了芝诺,形成了三人对话,于是就有了"三部创意曲",又恰好对应巴赫的另外15首三声部钢琴独奏曲。这一招既致敬了卡罗尔的故事,又向巴赫的作品致敬,可谓是青出于蓝而胜于蓝。
侯世达又在小对话开篇引用了埃舍尔的莫比乌斯带画作。这一手更高明,因为他在短短几行字里就把"哥德尔(数学)、埃舍尔(艺术)、巴赫(音乐)"这三个领域都巧妙地带出来了。这种炫技手法贯穿全书,读者会不断发现各种梗,有时甚至会觉得有点跑题。但这恰恰体现了侯世达的写作特点——不完全是为读者服务的,更多的是为了自己写得开心,就像我们做播客一样,重要的是自己聊得爽。
从写作风格来看,这本书既不遵循“金字塔原理”,也不遵循“坡道原理”,而是采用了“散文”方式——形散神不散。侯世达东一榔头西一棒槌,到处炫技、到处埋梗,但归根结底还是围绕着GEB、数学、逻辑和人工智能这条主线——讲数学时一定会提到音乐和美术,讲音乐时一定会涉及数学和绘画,讲绘画时也一定会联系数学和音乐。他不关心读者是否能跟上,完全是在抒发自己的感情和想象,想到哪写到哪。每一章都充满了高难度的概念,比如第二章就直接引入了MIU形式系统,对于不熟悉的读者来说可能会感到劝退,但侯世达老师不care。
(00:18:26 ) 芝诺禅宗谐音梗,你看出来了吗?
芝诺悖论,看似在说运动不存在,其实它触及了更深层的数学概念:无穷与有穷、离散与连续、无穷小等等。这些问题属于第二次数学危机的范畴,最终通过微积分和极限的概念得以解决。
更妙的是,卡罗尔在他的文章《乌龟跟阿基里斯说了什么》中,提出了一个更具颠覆性的观点:逻辑本身也存在无穷倒退的状况。这个观点巧妙地将芝诺悖论与自我指代、逻辑循环、怪圈联系起来,进而触及了第三次数学危机的核心——逻辑的困境。
侯世达在书中明显地致敬了卡罗尔。在卡罗尔提出这个观点之前,虽然哥德尔不完全性定理和罗素悖论已经出现,但很少有人将芝诺悖论与第三次数学危机(也就是逻辑问题)联系起来。卡罗尔能有如此独特的视角,实在令人佩服。
我们都知道芝诺悖论讲的是阿基里斯追不上乌龟,看似在讨论运动的可能性。但实际上,它所蕴含的深意远不止于此。侯世达将这个话题称为“三部创意曲”,这个命名本身就很有意思,更重要的是它背后所蕴含的深刻思考。
说到有意思,侯世达还玩了个谐音梗。还记得对话开头,乌龟和阿基里斯莫名其妙地开始讨论“风动还是幡动”吗?
在英文原版中,侯世达故意把“Zeno”(芝诺)和“Zen”(禅)搞混,制造了一个关于芝诺和禅师的笑点。可惜这个梗在中文翻译中无法体现,只有读英文版的读者才能get到他的幽默。
说到翻译,侯世达本人也参与了这本书的深度翻译工作。这本身就是件很有意思的事,尤其是在处理像“Zeno”和“Zen”这种难以直译的文字游戏和双关语时,更显功力。
(00:23:39 ) 什么是形式系统?
第一章名为“WU谜题”。
侯世达没有直接解释什么是形式系统,而是设计了一个名为“WU”的谜题,通过这个谜题让读者尝试解答——最终发现根本无解。通过这个谜题,侯世达试图引出并解释形式系统的概念——GEB全书的中心概念之一。
形式系统到底是什么呢?
核心理念其实很简单:一切都是形式系统(听君一席话,如听一席话式定义)。比如,人类语言就是一种形式系统。语言的语法规则,主语、谓语、宾语的排列组合,都是形式系统的一部分。从语法的角度看,句子的结构不过是符号的排列组合。而这些符号的排列组合如果符合一定的规则,就能产生有意义的语言。
例如,“我打球”是一句符合语法规则的句子,而“我苹果”则不符合,因为两个名词连在一起没有意义。通过语法规则,我们可以禁止不符合规范的组合,从而使语言变得有意义。
如果我们把所有的语法规则列出来,那么语言就变成了符号串的组合方式。同理,计算机语言由0和1的组合构成;音乐由音符和节奏的组合构成;美术作品由像素点的组合构成。这些都是形式系统。
形式系统的根本在于初始元素以及它们的排列规则。无论是语言、计算机代码、音乐还是美术,它们在形式系统的本质上没有区别。形式系统的理念是,世间万物皆为形式系统,一切都是形式系统,这种观点确实具有很大的杀伤力,因为它揭示了万物的本质。
形式系统是一种透过初始元素及其规则来理解世界的方法。而《哥德尔、埃舍尔、巴赫》这本书,正是通过形式系统的视角,带领我们进入一个跨学科的智力盛宴。
(00:30:22 ) 用国际象棋举个例子
世间万物皆为形式系统。乍一听可能觉得难以置信,但仔细想想,确实如此。形式系统就像一个隐藏在事物背后的框架,支撑着事物的运作。就像大楼需要钢架支撑一样,我们日常生活中解决问题的策略、思维模式,甚至复杂的数学体系,都可以看作是形式系统。
形式系统包含三个要素:
·形式语言 (Language): 就像我们说话需要词汇一样,形式系统也需要一套符号和语法规则来表达信息。
·公理 (Axioms): 这是一组被设定为真的基本命题,就像游戏规则一样,是形式系统的基础。
·推理规则 (Rules of Inference): 这是用来从公理推导出其他真命题的规则,就像游戏中的操作规则一样,规定了如何在形式系统中进行推理和演绎。
通过这三个要素,形式系统就能像机器一样运作,产生新的定理(Theorems),也就是从公理推导出来的真命题。用国际象棋来举例:
·形式语言: 国际象棋的棋盘、棋子、每个棋子的走法等,构成了游戏的语言和词汇表。
·公理: 游戏开始时的初始状态,比如棋子的摆放位置,就是游戏的公理,只有满足这些条件,游戏才能开始。
·推理规则: 棋子的移动规则,比如“马走日”,“象走田”等,就是游戏的推理规则,玩家需要根据这些规则移动棋子。
而游戏的目标“将死对方”,就是一个需要通过推理规则和策略来实现的定理。
上期提到:为什么要把很多过程分解成机械、可重复的形式?其实跟形式系统的本质密切相关。如果我们能把某些行为或事情,用形式系统的方式规范出来,那就更容易让人与人之间达成共识,避免很多不必要的混乱和争论。
(00:36:21 ) 侯氏龟能梦电子龟吗?
为唤起读者的好奇心,侯世达老师给大家贴心地设计了一个小小的谜题:“你能产生WU吗?”。这个谜题如果大家能耐心的读完,并且尝试一下,会发现很妙,很有趣。
我用侯世达同款对话编了一段小故事,可能让大家更容易理解这个”WU谜题”:
这天,阿喀琉斯和乌龟进入了一个名叫”WU迷宫"的迷宫,遇到了一只叫做"meta乌龟"的电子龟。
电子龟塞给了他们一个迷宫引导器,上书两个字母“WJ”。引导器有4条规则:
规则一:如果你有一个以 J结尾的字符串,你可以在它后面再加一个 U。比如 WJ 就可以变成 WJU。
规则二:假设你有 Wx,这里x是任意一个字符串。那么你可以把它变成 Wxx。比如WJU可以变成WJUJU。
规则三:如果你的字符串中有JJJ,你可以用U替换。比如WUJJJU可以变成WUUU。
规则四:如果你的字符串包含UU,你可以把它删除。如WUUU 可以变成 WU。
电子龟问:如果从“WJ”开始,能否通过有限步骤,走出迷宫,得到“WU”?
这就构成了一个典型的形式系统:它有明确的符号(W,J,U)、公理(WJ)和推理规则(规则1-4)。 阿喀琉斯和乌龟试图用这些规则去推导WJ,发现他们无论如何都无法从WJ推导出WU,而是不断地陷入"WJ-WJU-WJUJU-WJU-WU-WJ"的循环,无论如何都会陷入循环,都会回到原点WJ。
对此meta-乌龟给出了令人费解的禅宗式回应。它说:"WU”。一头雾水,再追问,还是只说"WU”。惜字如金。
乌龟突然一拍脑袋,对阿基利斯说: "WU"在禅宗中代表一种超越二元对立(如是与非、对与错、有与无)的智慧境界,电子龟再暗示我们不要执着于WJ和WU之间的逻辑纠缠,而应该跳出这个系统,用更高的智慧去看待问题啊!
好了这个莫名其妙的故事讲完了。
这个“WU的谜题”到底想说明什么?
(00:42:27 ) MIU还是WJ?
侯世达在介绍形式系统时,首先想传达的是"万物皆形式系统"这一理念。他希望读者明白,形式系统并非高深莫测,也不一定与数学、逻辑学或哲学挂钩。即便是简单如WJU这样仅有三个字母的系统,也是一个典型的形式系统。虽然它无法与人类语言、绘画、音乐或计算机系统相提并论,但麻雀虽小,五脏俱全,完全符合形式系统的基本条件。
这个简单系统的构造颇有意思。有趣的是,英文原版中这个形式系统叫MIU,而中文版则叫WJU。这里面大有文章:
MIU代表Mechanical(机械的)、Intelligent(智能的)和Un-(否定前缀),分别对应机械式推理、人类智能理解和禅宗的"无"概念。这三个概念与形式系统息息相关。
翻译成中文时遇到了挑战,因为对应的中文词汇首字母与英文不同。于是,译者巧妙地创造了新的对应关系:
·J代表"机",对应机械方式
·W代表"维"(本应为"唯",但用了"惟"),对应人类智能、逻辑思维
·U仍然代表"无",对应禅宗思想
这种翻译方式高度重视表意,但也不可避免地留下了一些"bug"。比如,按照逻辑,中文版应该是JWU而非WJU,以对应英文版MIU的顺序。但为了使开头更接近自然语言习惯,最终选择了WJU。
这种精心设计的翻译反映了侯世达对细节的极度重视,甚至到了"机关算尽"的地步。这本书中类似的细节还有很多,就像《红楼梦》一样,值得细细品味。但若要一个一个都挖出来,那根本挖不完。
(00:48:56 ) 机器能“跳出系统”吗?
侯世达通过WJU谜题巧妙地揭示了人类思维与机械逻辑之间的本质差异。这个看似简单的谜题实际上蕴含着深刻的哲学思考:人类思维能否被完全描述为一个形式系统?
谜题的关键在于"跳出系统"的能力。当面对无法解决的问题时,人类可以停下来,审视整个系统,发现规则的本质(如J的数量不会减少),从而得出结论。这种能力正是人类智慧的体现,也是区别于机械逻辑的关键所在。
(这里不得不琢磨,“WU”的读音就是“无”,这不就是在暗示要跳出系统,别钻牛角尖么?)
“跳出系统”:能够跳出正在进行的工作,并且看一下已经做了些什么,是智能固有的特点。比如我读GEB,读不下去的时候,搁在一边儿,把灯关掉。我就“出了GEB系统”。
但教计算机“跳出系统”,能教到什么程度呢?
书里举了一个实例:加拿大一次计算机国际象棋比赛,一个下棋不太强的程序,却有一个很牛的特性:它可以远在棋下完之前早早退出。棋下得不太好,但却有预先估计到没有希望的棋局的能力,然后停下,而不是等着另一个程序把它将死。虽然每次下棋它都输,但是输得很有风度,不丢人。
然而,这个例子其实并不完全贴切。因为程序的认输行为很可能仍然是基于预设的规则(如胜率评估)而非真正的"意识到自己在下棋"。
这引发了更深层次的思考:即使我们不断为计算机添加更高层次的规则,试图模拟人类的各种智能行为,是否有可能最终达到人类思维的灵活性?
人工智能工作的奇异之处:通过一系列严格的形式化规则,教会机器如何表现得灵活。然而,这些规则本身是死板的。但是要涵盖所有智能行为,需要各种不同层次的规则。从基本规则到修改这些基本规则的元规则,再到修改元规则的更高层次规则元元规则,都必须存在。
面对生活中千变万化的情况,我们需要多少层级的规则才能涵盖所有可能性?这些规则的堆叠是否有尽头?
更重要的是,人类"跳出系统"的能力与计算机执行预设规则导致的任务终止是有本质区别的。人类可以意识到自己正在某个系统中运作,并主动选择退出或改变视角。而计算机,无论其行为看起来多么智能,本质上仍然是在执行预设的程序逻辑。
(00:56:52 ) 大梗来了
终极的人工智能不可能论,主要论点在于机器什么时候能认识到自我,才能真正理解自己在一个系统中。这是传统的人工智能理论,而侯世达在他的书中通过一段话揭示了这一点。他写道:
“只有极少数的人有那种眼光看出一个支配许多人生活的系统,而以前却从来没人认为这是一个系统。这些人常就投入毕生的精力去使其他人相信系统确实存在,应该从中退出。”
这段话让你想到什么了吗?
没错,就是《黑客帝国》(The Matrix)。
虽然这部电影是在侯世达的书出版之后拍摄的,但两者的思想有相似之处。可以猜测,《黑客帝国》的导演可能读过侯世达的书,受到了启发。甚至可以推测 “缸中之脑”这个概念,虽然在GEB获得普利策奖之前已经存在,但侯世达可能是第一个系统性提出这一理论的人。
整个GEB都围绕一个核心理念展开,那就是“怪圈”。侯世达认为,人类的自我认知就是一个怪圈,而这个怪圈正是智能的核心。这本书的前两章已经埋下了无数的梗、暗线和隐喻,揭示了这一理念。
哥德尔不完全性定理是一个超级怪圈的典范。哥德尔通过数学方法证明了形式主义和逻辑主义的不成立。然而,哥德尔不完全性定理本身却是形式主义的巅峰之作,它用数字化的方法将形式符号编成数字来进行证明。哥德尔数的概念将形式符号量化,这种方法也可以用于推导其他形式系统,如WU谜题。
(01:02:14 ) 哥德尔和图灵机:人工智能的极限是什么?
图灵机本质上是一个概念性的计算机,它可以被看作是一个典型的形式系统,包含符号、初始状态和生成规则。它虽然简单,但理论上可以模拟任何计算机程序的运行。
哥德尔不完全性定理指出,任何包含基本算术的形式系统都必然存在一些命题,它们是真命题,但在这个系统内部却无法被证明。
那么问题来了:图灵机作为一种形式系统,是否也符合哥德尔不完全性定理?
首先,我们需要明确图灵机是否能够进行基本的数学运算。如果我们假定它可以,那么根据哥德尔不完全性定理,图灵机内部也应该存在一些无法被证明的真命题。
图灵本人提出的“停机问题”似乎印证了这一点。停机问题指的是,是否存在一个程序能够判断任意程序是否会在有限时间内停机。图灵证明了,这样的程序并不存在。
从形式上看,停机问题和哥德尔不完全性定理的表述非常相似。停机问题可以被看作是一个无法判断自身是否停机的程序,这与哥德尔不完全性定理中那个无法证明自身真伪的命题类似。
虽然很多人认为图灵停机问题和哥德尔不完全性定理是等价的,虽然这种说法并不严谨,其中涉及到很多细节问题,但不可否认的是,图灵停机问题确实与哥德尔不完全性定理存在着千丝万缕的联系。
如果我们能制造出图灵完备的计算机系统,是否意味着我们就能创造出人工智能?
对于这个问题,学界存在两种截然不同的观点:一种观点认为,只要计算机系统的规模足够大,就能够模拟人类智能。另一种观点则认为,计算机系统本质上只是一个逻辑系统,而哥德尔不完全性定理已经证明,逻辑系统无法推导出真正的数学或人类智能,更不可能拥有自我意识。
这两种观点的争论一直持续至今,尚无定论。
但无论是哥德尔不完全性定理还是图灵停机问题,都揭示了一个共同点:即使强大如计算机,也存在着无法逾越的“墙”,即“不可计算性”。
正如哥德尔不完全性定理表明,即使在完美的数学大厦中,也存在着逻辑无法触及的角落。图灵停机问题则更进一步,它直接在图灵机这一强大的计算模型中,展示了“不可计算性”的存在。
而人类,作为创造出这些概念的思考者,似乎能够跳出这个“怪圈”,从更高的维度俯瞰这一切。
或许,这正是人工智能与人类智能之间最根本的差异所在。人工智能始终受限于自身的逻辑系统,而人类却能够凭借直觉和意识,超越逻辑的藩篱。
关于《文理两开花》:
《文理两开花》是文科生思维和理科生思维在科技、经济、文化、哲学、货币、数字资产、元宇宙、Web3.0中的碰撞。当下的时代精神是“混沌”,我们试图在混沌中寻找秩序。
Twitter:
@LeiSalin_XP
@Will42W
TG群(开放):t.me
收听平台:
小宇宙:文理两开花
苹果播客|Spotify | Google Podcast | 等泛用型平台搜索收听《文理两开花(海外版)》(苹果播客中国区可复制https://open.firstory.me/rss/user/cl0roq