127: 与真格戴雨森 25 AI 中场复盘：OpenAI的IMO金牌、Kimi K2翻盘、Agent普及和抢人大战

Update: 2025-07-21

Description

「一个登月时刻？」

今天的嘉宾，是 106 期曾做客《晚点聊》的真格基金管理合伙人戴雨森。这期节目分两次录制，一次是在上周，在 2025 年年中的复盘和展望时刻，我们聊了真格投资的月之暗面新鲜出炉的 K2，AI 应用普及这条大主线的变化，和近期热闹非凡的抢人大战。

一次是在今天（7月21日）下午。我们补充聊了刚刚发生的新进展：OpenAI 在上周五发（7月18日）布了ChatGPT Agent，更重要的是，这个周末（7月19日），OpenAI 又宣布用一个未公开的通用大语言模型，第一次达到了 IMO国际奥赛金牌水准。这之前，只有 Google DeepMind 针对数学专门做优化的模型达到过银牌水平。

2 年半前，曾写下《通用人工智能的火花》的现 OpenAI 研究员 Sébastien Bubeck 形容，这（通用大语言模型拿下IMO金牌）最终可能会成为一个登月级别的进展。

已持续两年多的AI竞速没有放缓，模型能力与应用创新交替上升，而两者的进化速度，可能都在被低估。

本期主播：程曼祺，《晚点 LatePost》科技报道负责人

本期嘉宾：戴雨森，真格基金管理合伙人，*投资了 Kimi（月之暗面）、与爱为舞、无问芯穹、Genspark *等 AI 项目。

时间线跳转：

-OpenAI 拿下 IMO 金牌，又一个李世石时刻

01:06 OpenAI 新模型拿下 IMO 金牌：首个到这一水平的通用 LLM、强化学习也能处理难判别任务、Google 也做到了？

图注：Jason Wei 博文中“验证的非对称性”图示，落在红色斜线下方的任务更容易被 AI 全自动化地完成。

14:38 抢人大战后，Meta 谁都不服谁的情况可能更严重

16:31 ChatGPT Agent 不惊艳，但别低估它；“壳”的价值在于 context

-再谈 AI 应用普及：最重要的、被高估的、被低估的

27:39 总要进展：Coding 和推理能力持续提升、Agent 形态有了初步共识、多模态更实用了

图注：OpenAI 研究院、强化学习专家 Noam Brown 发 Twitter 提到，拿到 IMO 金牌的模型与 Multi Agent 有关。

33:59 机器人进厂打螺丝的速度，被高估了；应用（壳）的价值、优秀团队的韧性、模型进展速度被低估了

40:53 从 All in AI 到外卖大战？

-不同公司，走向各自的未来

42:37 DeepSeek R2，等待新基模

43:43 字节 Seed 组织的进一步分工：Edge、Focus、Base

46:39 K2，Kimi 的乔戈里峰

图注：7月22日 OpenRouter 编程类目模型调用，K2 已从上周二发布第 4 天时的第 10 上升到第 5。

58:32 技术排位变化：Google is back、ChatGPT 更强化超级应用、Anthropic 也自己“造壳”