E161｜聊聊大模型如何思考与深度学习科学家Yann LeCun

Update: 2024-07-29

Description

当人们输入一个数据，大模型就能直接输出一个答案，但是它的运作机制却没人知道，我们称之为“黑盒”。也正因为黑盒模型的不可解释性，AI的安全问题受到很多大佬的质疑。于是科学家们开始试图去打开大模型的黑盒子，业内称之为“白盒研究”。

一方面，白盒模型的研究能帮助人们理解黑盒模型，从而对大模型进行优化和效率的提升。另一方面，白盒研究的目标是把AI这一工程性学科推向科学。

今天我们邀请的嘉宾陈羽北，他的研究内容就与白盒有关，之前他也是著名深度学习专家Yann LeCun的博士后，我们今天将和他聊聊白盒模型的研究进展，以及Yann这位经历过AI行业起起伏伏，却依然纯粹专注的科学家。

【主播】

泓君Jane，硅谷101创始人，播客主理人

【嘉宾】

陈羽北，加州大学戴维斯分校电子与计算机工程系助理教授

【你将听到】

【大模型 vs 人脑】

02:09 白盒研究的目标：把AI从工程推向科学

02:53 从早期模型到大语言模型，如何识别词汇的元意思

06:51 OpenAI的研究：用gpt4理解gpt2模型

08:46 白盒研究的本质是理解信号的结构，从而提升模型效率

11:37 人脑如何通过少量数据获得泛化的能力

12:46 比起人脑，大语言模型观测手段多，但它对世界的理解不够

20:11 稀疏编码：源自大脑神经元的运作机制

【白盒研究】

22:01 黑盒模型发展很快：只求工作，不求简洁

24:56 白盒模型的问题：过度简洁

27:19 Yann Lecun：支持白盒研究但不确定走得通

28:25 基础AI研究靠好奇心驱动，而非商业化

30:16 白盒模型的三个流派：可视化、神经科学、数学统计

32:30 对黑盒模型的优化：提升效率、统一不同模型

33:44 距离白盒gpt还很远，发展是阶段性的

35:29 打开ImageNet是白盒的第一步

【关于Yann LeCun】

38:21 Yann经历了神经网络领域历史上的高峰低谷

39:45 加入Yann LeCun组是偶然

42:51 Yann对大方向的坚持和直觉

43:02 “不反对Scaling Law，但只堆数据是不够的”

49:10 科学家马毅 & Yann，观点并不冲突：高层次的规律是简洁的

51:58 从至暗时刻走出的AI科学家们：专注、纯粹

53:55 Yann希望学生可以做与时间共存的工作

55:57 “读PhD不应该研究LLM”

57:24 Yann在Meta的贡献：筹建Meta AI、开源路线

60:29 大模型未来的发展：Scaling Law依然重要，但提升效率也很重要

【相关人物】

Yann LeCun：计算机科学家，在机器学习、计算机视觉、移动机器人和计算神经科学等领域都有很多贡献，被誉为“卷积神经网络之父”，现任Meta首席AI科学家，并担任纽约大学教授。他在1980年代率先提出了卷积神经网络（CNN），这项技术成为现代计算机视觉的基础。LeCun与Geoffrey Hinton和Yoshua Bengio共同获得2018年图灵奖，表彰他们在深度学习方面的开创性工作。

【监制】

Holiday

【后期】

AMEI

【BGM】

Alteration - Karoliina Gabel

Listen to the Forest Weep - Hanna Lindgren

【在这里找到我们】

公众号：硅谷101

收听渠道：苹果｜小宇宙｜喜马拉雅｜蜻蜓FM｜网易云音乐｜QQ音乐｜荔枝播客

海外用户：Apple Podcast｜Spotify｜TuneIn｜Youtube｜Amazon Music

联系我们：podcast@sv101.net

Special Guest: 陈羽北.

Comments

Top Podcasts

The Best New Comedy Podcast Right Now – June 2024 The Best News Podcast Right Now – June 2024 The Best New Business Podcast Right Now – June 2024 The Best New Sports Podcast Right Now – June 2024 The Best New True Crime Podcast Right Now – June 2024 The Best New Joe Rogan Experience Podcast Right Now – June 20 The Best New Dan Bongino Show Podcast Right Now – June 20 The Best New Mark Levin Podcast – June 2024

In Channel

E178｜智能眼镜大战CES：靠AI不如产品硬

2025-01-1752:54

E177｜“没有AI我会难受至极”：与大学生聊聊智能工具的依赖与适应

2025-01-0701:02:39

E176｜SpaceX 的商业版图与太空经济的崛起

2024-12-2001:09:39

E175｜专访导演方励：人类没有未来

2024-12-1201:11:00

E174｜当巨头们失去了创新力，聊聊如何做一双好鞋

2024-12-0201:01:05

E173｜一个对硅谷教育不满的老师，做了一所自己的学校

2024-11-2254:23

E172｜大选影响下的硅谷：比特币总统、逆行者与反觉醒文化

2024-11-1401:00:17

E171｜濒临破产的23andMe与基因检测行业的新旧交替

2024-11-0701:04:34

E170｜大模型应用之困与异军突起的“埃森哲们”

2024-10-2401:22:28

E169｜特斯拉Robotaxi发布会的台前幕后：兴奋的现场与失望的华尔街

2024-10-1401:12:08

E168｜全息显示的AR眼镜真的来了，聊聊Meta Connect与日趋成熟的XR生态

2024-10-0601:22:10

E167｜聊聊顶流网红做服装：卡戴珊与她的内衣王国Skims

2024-09-2901:11:29

E166｜聊聊火人节与硅谷精神：挑战规则、反叛权威的双生花

2024-09-2001:08:32

活动预告：我们硅谷线下见

2024-09-1902:13

E165｜智能眼镜爆发前夜，与Ray-Ban Meta产品经理聊聊如何打造一款热门AI眼镜

2024-09-0601:20:36

E164｜当电影遇上AI：与好莱坞特效美术聊聊他们和新工具的博弈

2024-08-2259:43

E163｜与大疆Pocket首任产品经理聊聊：如何从无到有定义一款硬件产品？

2024-08-1657:19

E162｜清华姚班如何培养天才：给最有挑战性的问题和足够的自由度

2024-08-0701:03:54

E161｜聊聊大模型如何思考与深度学习科学家Yann LeCun

2024-07-2901:01:29

E160｜重新理解信息茧房：为何科学研究与我们主观感受相反？

2024-07-2452:02

00:00

E161｜聊聊大模型如何思考与深度学习科学家Yann LeCun

#box-pro-ellipsis-173821472692819{-webkit-line-clamp:2;}E161｜聊聊大模型如何思考与深度学习科学家Yann LeCun

E161｜聊聊大模型如何思考与深度学习科学家Yann LeCun

硅谷101

E161｜聊聊大模型如何思考与深度学习科学家Yann LeCun