Discover此话当真和戴雨森的 2025 AI 中场复盘:OpenAI 的 IMO 金牌、Kimi K2 翻盘和 Agent 普及
和戴雨森的 2025 AI 中场复盘:OpenAI 的 IMO 金牌、Kimi K2 翻盘和 Agent 普及

和戴雨森的 2025 AI 中场复盘:OpenAI 的 IMO 金牌、Kimi K2 翻盘和 Agent 普及

Update: 2025-08-09
Share

Description

「一个登月时刻?」

本期是「此话当真」与「晚点聊 LateTalk」的串台节目,真格基金管理合伙人戴雨森和晚点的曼祺聊了一期 2025 AI 中场复盘,以及刚刚发生的新鲜事。

这期节目分两次录制,一次是在上周,在 2025 年年中的复盘和展望时刻,我们聊了真格投资的月之暗面新鲜出炉的 K2,AI 应用普及这条大主线的变化,和近期热闹非凡的抢人大战。

一次是在昨天(7 月 21 日)下午。我们补充聊了刚刚发生的新进展:OpenAI 在上周五(7 月 18 日)发布了 ChatGPT Agent,更重要的是,这个周末(7 月 19 日),OpenAI 又宣布用一个未公开的通用大语言模型,第一次达到了 IMO 国际奥赛金牌水准。这之前,只有 Google DeepMind 针对数学专门做优化的模型达到过银牌水平。

2 年半前,曾写下《通用人工智能的火花》的现 OpenAI 研究员 Sébastien Bubeck 形容,这(通用大语言模型拿下 IMO 金牌)最终可能会成为一个登月级别的进展。

已持续两年多的 AI 竞速没有放缓,模型能力与应用创新交替上升,而两者的进化速度,可能都在被低估。

OpenAI 拿下 IMO 金牌,又一个李世石时刻

01:06 OpenAI 新模型拿下 IMO 金牌:首个到这一水平的通用 LLM、强化学习也能处理难判别任务、Google 也做到了?

14:38 抢人大战后,Meta 谁都不服谁的情况可能更严重

16:31 ChatGPT Agent 不惊艳,但别低估它;「壳」的价值在于 context

再谈 AI 应用普及:最重要的、被高估的、被低估的

27:39 总体进展:Coding 和推理能力持续提升、Agent 形态有了初步共识、多模态更实用了

33:59 机器人进厂打螺丝的速度,被高估了;应用(壳)的价值、优秀团队的韧性、模型进展速度被低估了

40:53 从 All in AI 到外卖大战?

不同公司,走向各自的未来

42:37 DeepSeek R2,等待新基模

43:43 字节 Seed 组织的进一步分工:Edge、Focus、Base

46:39 K2,Kimi 的乔戈里峰

58:32 技术排位变化:Google is back、ChatGPT 更强化超级应用、Anthropic 也自己「造壳」

<p style="font
Comments 
In Channel
loading
00:00
00:00
x

0.5x

0.8x

1.0x

1.25x

1.5x

2.0x

3.0x

Sleep Timer

Off

End of Episode

5 Minutes

10 Minutes

15 Minutes

30 Minutes

45 Minutes

60 Minutes

120 Minutes

和戴雨森的 2025 AI 中场复盘:OpenAI 的 IMO 金牌、Kimi K2 翻盘和 Agent 普及

和戴雨森的 2025 AI 中场复盘:OpenAI 的 IMO 金牌、Kimi K2 翻盘和 Agent 普及