Discover晚点聊 LateTalk127: 与真格戴雨森 25 AI 中场复盘:OpenAI的IMO金牌、Kimi K2翻盘、Agent普及和抢人大战
127: 与真格戴雨森 25 AI 中场复盘:OpenAI的IMO金牌、Kimi K2翻盘、Agent普及和抢人大战

127: 与真格戴雨森 25 AI 中场复盘:OpenAI的IMO金牌、Kimi K2翻盘、Agent普及和抢人大战

Update: 2025-07-21
Share

Description

「一个登月时刻?」



今天的嘉宾,是 106 期曾做客《晚点聊》的真格基金管理合伙人戴雨森。这期节目分两次录制,一次是在上周,在 2025 年年中的复盘和展望时刻,我们聊了真格投资的月之暗面新鲜出炉的 K2,AI 应用普及这条大主线的变化,和近期热闹非凡的抢人大战。



一次是在今天(7月21日)下午。我们补充聊了刚刚发生的新进展:OpenAI 在上周五发(7月18日)布了ChatGPT Agent,更重要的是,这个周末(7月19日),OpenAI 又宣布用一个未公开的通用大语言模型,第一次达到了 IMO国际奥赛金牌水准。这之前,只有 Google DeepMind 针对数学专门做优化的模型达到过银牌水平。



2 年半前,曾写下《通用人工智能的火花》的现 OpenAI 研究员 Sébastien Bubeck 形容,这(通用大语言模型拿下IMO金牌)最终可能会成为一个登月级别的进展。





已持续两年多的AI竞速没有放缓,模型能力与应用创新交替上升,而两者的进化速度,可能都在被低估。



本期主播:程曼祺,《晚点 LatePost》科技报道负责人



本期嘉宾:戴雨森,真格基金管理合伙人,*投资了 Kimi(月之暗面)、与爱为舞、无问芯穹、Genspark *等 AI 项目。



时间线跳转:

-OpenAI 拿下 IMO 金牌,又一个李世石时刻

01:06 OpenAI 新模型拿下 IMO 金牌:首个到这一水平的通用 LLM、强化学习也能处理难判别任务、Google 也做到了?



图注:Jason Wei 博文中“验证的非对称性”图示,落在红色斜线下方的任务更容易被 AI 全自动化地完成。

14:38 抢人大战后,Meta 谁都不服谁的情况可能更严重

16:31 ChatGPT Agent 不惊艳,但别低估它;“壳”的价值在于 context



-再谈 AI 应用普及:最重要的、被高估的、被低估的

27:39 总要进展:Coding 和推理能力持续提升、Agent 形态有了初步共识、多模态更实用了



图注:OpenAI 研究院、强化学习专家 Noam Brown 发 Twitter 提到,拿到 IMO 金牌的模型与 Multi Agent 有关。

33:59 机器人进厂打螺丝的速度,被高估了;应用(壳)的价值、优秀团队的韧性、模型进展速度被低估了

40:53 从 All in AI 到外卖大战?



-不同公司,走向各自的未来

42:37 DeepSeek R2,等待新基模

43:43 字节 Seed 组织的进一步分工:Edge、Focus、Base

46:39 K2,Kimi 的乔戈里峰



图注:7月22日 OpenRouter 编程类目模型调用,K2 已从上周二发布第 4 天时的第 10 上升到第 5。

58:32 技术排位变化:Google is back、ChatGPT 更强化超级应用、Anthropic 也自己“造壳”



-应用的生长

01:15:23 雇佣 AI——1个月 1000 美元的 AI 订阅费

01:23:19 Agent 的应用进展需要新的 L3 模型

01:30:22 在硅谷,对创业产品的像素级模仿为何较少发生



-新的提问

01:35:35 持续好奇:如何衡量智能的边界?

01:38:00 灰犀牛:当个人有了大量生产力,怎么处理效率 vs 公平?


01:43:31 未来几个月想验证的悬念?——L3 模型如何到来

01:48:37 一款契合 AI 创业者的游戏《33 号远征队》



相关链接:

晚点聊 106 期:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need

晚点聊 110 期:与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专

晚点聊 103 期:用Attention串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进

Context Engineering for AI Agents: Lessons from Building Manus 《AI Agent 的上下文工程:从构造 Manus 中学到的》(Manus 联创季逸超近期发布的 Context Engineering 文章)

Sparks of Artificial General Intelligence: Early experiments with GPT-4《通用人工智能的火花:GPT-4 的早期实验》

Asymmetry of verification and verifier’s law《验证的不对称性和验证者法则》(Jason Wei 近期博文)



剪辑制作:甜食、Nick



本期主播:

小红书@曼祺_火柴Q即刻@曼祺_火柴Q





☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆



欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。

这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。



请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。





关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:



Comments 
In Channel
loading
00:00
00:00
1.0x

0.5x

0.8x

1.0x

1.25x

1.5x

2.0x

3.0x

Sleep Timer

Off

End of Episode

5 Minutes

10 Minutes

15 Minutes

30 Minutes

45 Minutes

60 Minutes

120 Minutes

127: 与真格戴雨森 25 AI 中场复盘:OpenAI的IMO金牌、Kimi K2翻盘、Agent普及和抢人大战

127: 与真格戴雨森 25 AI 中场复盘:OpenAI的IMO金牌、Kimi K2翻盘、Agent普及和抢人大战

晚点 LatePost