Discover晚点聊 LateTalk
晚点聊 LateTalk
Claim Ownership

晚点聊 LateTalk

Author: 晚点 LatePost

Subscribed: 244Played: 2,252
Share

Description

《晚点聊 LateTalk》由《晚点 LatePost》出品。
最一手的科技访谈,最真实的从业者思考。
148 Episodes
Reverse
「华为前自动驾驶首席科学家投身具身创业。」 本期嘉宾是它石智航创始人陈亦伦,他曾担任大疆创新机器视觉总工程师和华为自动驾驶部门首席科学家。 2021 年,智能辅助驾驶的爆发前夕,陈亦伦在华为带团队开始采集大量真实的驾驶数据,用深度学习替代过去自动驾驶的规则方法,3 万行代码做了过去 200 万行代码的事,这是业界第一批探索端到端智能驾驶的尝试。 陈亦伦说,那一刻,他觉得自己找到了自动驾驶的钥匙,而他还想用这把钥匙去探索一个年少时种下的更大梦想:通用智能机器人,也就是具身智能。 在回到母校清华,于 AIR(智能产业研究院)担任智能机器人方向首席专家 2 年后,2025 年初,陈亦伦和百度原资深副总裁、百度智能驾驶事业群负责人李震宇一起创立它石智航,在最初 2 轮融资中,筹集了超过 2.4 亿美元。创下中国具身智能领域的首轮融资记录。 这期节目,陈亦伦讲述了他从自动驾驶到具身智能的多年技术探索和研发实践,他看到的具身智能的 3 道曙光和 3 道关卡,以及怎么先越过其中的第一道:数据。 本期嘉宾:陈亦伦,它石智航创始人兼 CEO 本期主播:程曼祺,晚点 LatePost 科技报道负责人 时间线: -从华为、清华到创立它石,看到具身的三道曙光 02:35 用神经网络做自驾规控(PnC),3 万行替代 200 万行代码 11:13 三道曙光:强化学习提升运控(locomotion)能力;LLM 处理任务规划;端到端解决极端案例 17:13 端到端、VLA、世界模型,联系与区别 20:40 三道关卡:数据、算法、后训练 24:43 具身还在第一道关卡,数据;最后能经受大量数据的算法结构会很简单;GPT 最伟大的是定义了训练任务是预测下一个 token,而非架构本身 30:16 定义具身模型的训练任务:建立空间概念、跟世界交互 -数据解法:真实数据而非仿真和视频数据,手套采集而非遥操 40:54 具身需要真实数据,不看好仿真和视频数据 49:42 真实数据只有两个源头,世界与人;真实意味着场景真实、动作真实;为可穿戴设备是唯一解 55:08 手套+第一视角摄像头采集数据的具体实现 59:11 具身充满了硬件场景、本体、数据算法间的交替组合和协同优化,中国有供应链和场景优势 01:05:08 没有选择 VLA,具身会有自己的模型,而不是简单在 LLM 上发展 具身已经到了 Scaling 的临界点 01:13:23 看数据增长趋势,具身已经到了 Scaling 的临界点 01:18:04 它石的落地场景之一是处理柔性材料的线束装配 01:21:15 能自己定义目标的具身公司就是靠谱的;成为别人,不是好的选择 01:22:38 连点成线:往期分享 往期具身智能访谈: 晚点聊 112 期:与千寻高阳聊具身:一个像机器人的人,怎么做像人的机器人 (https://www.xiaoyuzhoufm.com/episode/68109c65d44eb392638f3eba?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 晚点聊 96 期:和楼天城聊 Robotaxi:学习人类优秀司机,让我绝望 (https://www.xiaoyuzhoufm.com/episode/676c92ed4e2405e3fde38272?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 晚点聊 86 期:We, Robot-2,清华叉院/星海图许华哲看“Optimus”的门道 (https://www.xiaoyuzhoufm.com/episode/671eaa8fd6db5bf9593a1e6f?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 晚点聊 65 期:信仰充值的威力:与逐际动力谌骅聊聊 GTC 和人形机器人新进展 (https://www.xiaoyuzhoufm.com/episode/68a6546b7357a4b631fe8cd3) 剪辑制作:甜食 小红书@曼祺_火柴Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token=YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw-EfCtqmFTkCIM2o=&xsec_source=app_share&xhsshare=CopyLink&appuid=5dfa9e92000000000100626f&apptime=1736682459&share_id=331aecb9ca7941f498d81fb9c32ea810)即刻@曼祺_火柴Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/%E6%92%AD%E5%AE%A2-%E7%BB%93%E5%B0%BE%E4%BD%9C%E8%80%85%E7%AD%BE%E5%90%8D.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
「Agent 的工具可以以终为始。」 今天这期节目,是晚点的作者祝颖丽对 OiiOii 创始人闹闹的访谈。本次访谈的文字版今天也会发布在《晚点科技》公众号上。 OiiOii 是一款动画创作 Agent。刚刚在 25 年 11 月开启内测。闹闹自己是一名动画爱好者,2014年,在微信工作 3 年后,她辞职学了半年动画。但当时她发现,做动画太难了,行业环境也很糟。 时隔10年,在自己创过业,去字节做过剪映,在大模型公司阶跃星辰做过二次元社区产品“狸谱”之后,她找到了用 AI 延续动画梦想的方法。 这期,闹闹分享了她和团队是如何构思和做出 OiiOii 的,以及她过去的创业和大厂经历。 https://pic4.fukit.cn/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20260106/JhBR/1702X1232/%E6%88%AA%E5%B1%8F2026-01-06_19.31.44.png/webp 图:OiiOii 官网页面。地址:https://www.oiioii.ai/home) 本期嘉宾:闹闹,OiiOii 创始人 本期主播:祝颖丽,《晚点 LatePost》 作者 时间线跳转: 05:06 先做好工具,再去做内容的社区:因为大家不再能忍受内容的单调了 11:40 市场现状:现在动画的产能和消费非常不对等 16:46 OiiOii为什么是这个形态? 31:04 如果做AI漫剧,商业模式、审美都不一样 41:30 怎么利用和理解不同的模型 51:50 现在的团队分工 53:50 第一次创业做极限运动社区,发现其实喜欢做内容 01:06:17 第一次创业留下的最宝贵的东西:抗体 01:18:15 在字节:对剪映和抖音特效最大贡献是… 01:27:17 去了B站:看到产能被憋着了 01:28:45 OiiOii 后面大致的节奏:填充垂类内容,去海外,做内容社区 往期「AI 应用/AI Agent」创始人访谈: 晚点聊 136:Sora新世界 & Lovart 4个月复盘 | 与陈冕聊怎么做垂类 (https://www.xiaoyuzhoufm.com/episode/68e82298b97d3bce02b4f815?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 晚点聊 125:用AI复刻一个「我」,与心识宇宙陶芳波聊身份模型 (https://www.xiaoyuzhoufm.com/episode/687437ef3246f7333b55747a?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 晚点聊 111:Pokee.ai 朱哲清的 Agent 造法:强化学习作后端,语言模型作前端 (https://www.xiaoyuzhoufm.com/episode/680818eb79d324fdd40c2b5e?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 《晚点对话明超平:他们不信 AI coding 会是新的创作方式,我很开心》 (https://mp.weixin.qq.com/s/CTzqphisNyyj11DVglZO3A) 剪辑制作:Nick ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
「一线开发者看到的前排变化。」 本期是 137 期 Agentic 工具链节目的嘉宾返场,Henry 和 Naomi,他们近期刚刚和普林斯顿 AI 加速创新中心联席主任,王梦迪教授,一起成立了一家新的早期 VC,MoE capital。 这次一起的也有两位之前在 Google DeepMind 和 谷歌云 Vertex AI 平台工作 7 年,刚刚创业,成立 Agent 工具层公司 Precur 的戴涵俊和 Bethany。 我请他们分享了,岁末年初,在硅谷观察到的 AI 水温,OpenAI、Google 等一系列新模型进展背后的故事,和围绕当今 Agent 与 RL 生态的创业机会。 这是我们本年关于 Agent 的第 8 期节目。 本期嘉宾: Bethany Wang,Precur 联创 戴涵俊,Precur 联创 Henry Yin,MoE Capital 创始合伙人 Naomi Xia,MoE Capital 创始合伙人 本期主播: 程曼祺,晚点 LatePost 科技报道负责人 时间线: -基础模型竞争和幕后故事:Google 在旧金山开 Gemini 3 Party 的同一天,OpenAI 发布 GPT-5.2 06:11 AI 进入实用工作:OpenAI 的 GDPval,Databricks 也发布了 Office QA 14:25 GDPval 在主流知识工作上表现优秀,但基础模型处理长尾问题的 gap 始终存在 19:09 Gemini 3 后,OpenAI、Anthropic、Google、各自的进展 22:15 NotebookLM 和 Nano Banana 策源地——Google Labs,不仅招工程师,也有主编、作家、创作者 24:54 DeemMind 研究员 Orio:Gemini 3 的秘密?预训练还有很多空间;TPU 对 Google 训练的加持 https://pic4.fukit.cn/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20251226/CtEk/1178X828/%E4%B8%8B%E8%BD%BD.png/webp 26:34 Google 的 3 层协同优化:从 TPU 到 Infra 到模型;模型和应用;数据和硬件 surface(终端) 30:18 Google TPU 已经更多对外,这对英伟达 GPU 优势的影响 38:02 回顾组织变化:DeepMind 和 Google Brain 的合并与磨合 -大厂竞争中,新公司的成长:围绕 RL 与 Agent 的创业机会 43:31 垂类的机会:弥补基础模型到具体问题的差距;水平的机会:调度层、数据层、工具层都有新公司涌现 50:17 技术新趋势——自我演化:RL、用 RAG 加长记忆有人尝试,但远不是成熟方案 53:32「可训练的工具层」背后的技术变化:code 驱动工具,如 Anthropic 的 PTC(Programmatic Tool Calling) 59:44 RL 创业方向:RL 环境,RL as a Service,RL 应用 01:08:47 Agent 开发者挑选模型的前置条件:用什么云(比如 Azure 客户用不了 Gemini),再看云厂商折扣 01:12:20 Anthropic 的 Claude Code 已成为 Agent 核心,刚发布的 Promatic to Call 探索新开发范式 01:17:13 开源模型使用体验:Qwen 很棒;驶往 NeurIPS 的飞机上,1/3 人在看 DeepSeek-V3.2 技术报告 01:22:04 选择模型时,关注什么 benchmark & 为什么? 01:29:34 模型优化方向预测:加入大量 agent trace 的开源模型,更强的多模态,长程任务优化 01:38:58 连点成线:往期节目推荐 《晚点聊》今年关于 Agent 的更多节目: 晚点聊 106 期:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need (https://www.xiaoyuzhoufm.com/episode/67cdb53f7ccfd410926b0c66) 晚点聊 110 期:《与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专》 (https://www.xiaoyuzhoufm.com/episode/67fd8cafcc06f8ff48a73642) 晚点聊 111 期:Pokee.ai 朱哲清的 Agent 造法:强化学习作后端,语言模型作前端 (https://www.xiaoyuzhoufm.com/episode/680818eb79d324fdd40c2b5e) 晚点聊 130 期:手机Agent大幕拉开!从刚上线的AutoGLM 2.0聊起,大模型如何改造手机 (https://www.xiaoyuzhoufm.com/episode/68a6546b7357a4b631fe8cd3) 晚点聊 136 期:Sora新世界 & Lovart 4个月复盘 | 与陈冕聊怎么做垂类Agent| (https://www.xiaoyuzhoufm.com/episode/68e82298b97d3bce02b4f815) 晚点聊 137 期:Agent 是机会,造 Agent 的工具也是|从OpenAI开发者日聊起 (https://www.xiaoyuzhoufm.com/episode/68f1727052f01d1dd2a00523) 晚点聊 138 期:从你用手机到它更懂你,OPPO的手机AI实践 |与小布负责人万玉龙聊端侧AI (https://www.xiaoyuzhoufm.com/episode/68faad2749540bd15c2ee589) 附录: 本期中提到的一些 benchmark: -GDPVal:OpenAI 今年 10 月发布的、用于评估大模型在复杂推理与决策场景中“价值对齐与结果质量”的验证型 benchmark,强调输出是否符合人类偏好而不只是“做对题”。 -ARC-AGI-2:ARC Prize 今年 3 月发布的、用于测试模型在少样本条件下的抽象、组合推理能力,被视为接近“通用智能门槛”的挑战集。 -OfficeQA:Databricks 今年 12 月发布的、围绕办公场景(文档、表格、邮件、日程等)的 benchmark,用来评估模型在真实工作流中的信息检索、理解与执行能力。 本期中提到的一些产品/服务、公司 -PTC(Programmatic Tool Calling):Anthropic 今年 11 月底发布的一种新的工具调用方法 https://www.anthropic.com/engineering/advanced-tool-use -Tinker:Thinking Machines Lab 今年 10 月发布的首个对外产品 https://thinkingmachines.ai/blog/announcing-tinker/ -Preference Model:一家旧金山初创企业,做强化学习环境 剪辑制作:甜食、Nick 小红书@曼祺_火柴Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token=YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw-EfCtqmFTkCIM2o=&xsec_source=app_share&xhsshare=CopyLink&appuid=5dfa9e92000000000100626f&apptime=1736682459&share_id=331aecb9ca7941f498d81fb9c32ea810)即刻@曼祺_火柴Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/%E6%92%AD%E5%AE%A2-%E7%BB%93%E5%B0%BE%E4%BD%9C%E8%80%85%E7%AD%BE%E5%90%8D.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
「创业治好了我的死亡焦虑。」 极壳是第一家把外骨骼做成消费级产品的公司。21 年成立以来,他们经历过账上只有20万元人民币的危急时刻,也刚在今年融到了 7000 万美元,出货量达到数万台。 https://pic4.fukit.cn/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20251217/tCS8/2390X794/%E6%88%AA%E5%B1%8F2025-12-17_13.38.57.png/webp 图注:极壳已发布 4 款消费级外骨骼产品。 这只是个开始,远远不意味着成功。孙宽多次告诉我们,消费级外骨骼还在非常早期的阶段;他享受定义一个新品类的乐趣,也深知跨越鸿沟,走出小众市场的挑战。 这是一家起步时没有风口的公司;这是一个父母开手机卖场,从小做各种发明,但没有名校光环的创始人。 孙宽分享了他早年的“折腾”经历,他创立极壳、开发出第一款产品的故事,以及他对未来的更多想象。 https://pic4.fukit.cn/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20251217/Uwyx/1279X1706/WechatIMG60.jpg/webp 图注:孙宽是一个户外爱好者;极壳的主要目标用户是户外人群,外骨骼可以帮助他们增强运动能力。 本期嘉宾:孙宽,极壳创始人 & CEO 本期主播: 程曼祺,《晚点 LatePost》科技报道负责人 李梓楠,《晚点 LatePost》科技报道作者 时间线跳转: -水滴字幕、光固化 3D 打印机、3 年轮岗、内部创业 03:05《攻壳机动队》、90 后的科学幻想、技术是魔法 13:25 第一份工作:从轮岗 3 年到模块化 PC 的内部创业 18:27 一次误诊后回到初心:做一件做着做着挂了的事也不会后悔 -从 1 人公司,到第一款消费级外骨骼 26:51 1 人公司手搓原型,一度账上只有 20 万元人民币 40:06 做“真有用”的消费级外骨骼:拉高核心正面效果,尽量降低负面影像 49:41 推倒第一代方案,用户体验比新架构重要 01:04:27 正式交付 Hpershell X,有人日行 7 万步,有人重返户外 -效率的迭代:从 40 个月到 5 个月 01:09:11 从成立到第一款产品,40 个月;第二代产品,5 个月 01:05:08 从 1 人公司,到 4 位联创和 200+团队 01:25:47 对拓竹组织的观察:好的人,希望身边都是好的人 -跨越鸿沟 01:32:52 品类跨越鸿沟:营造向往、价格、自研、形态拓展 01:49:47 组织跑得更快 -创业之后更踏实了,“活对了的感觉” 01:56:22 创业治好了我的“死亡恐惧”。 01:59:53 广义的外骨骼,最终是让我们的身体可编程。 02:05:40 连点成线:后记 & 往期节目推荐 往期「消费科技」创始人访谈: 晚点聊 120 期:科创板后再访Insta360刘靖康:这何尝不是一种极限运动! (https://www.xiaoyuzhoufm.com/episode/684b3febcdecf72d4cb70f82) 晚点聊 141 期:大疆激光雷达前负责人做了台“电动轮椅”?与 Strutt 洪小平聊创业两年半:不做人形也能通向具身 (https://www.xiaoyuzhoufm.com/episode/6923997b83aceb424d94f667?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 往期「AI 硬件」创始人访谈: 晚点聊 107 期:与Haivivi李勇聊月入千万的AI Jellycat:小众AI硬件×大众消费品的交叉口创业 (https://www.xiaoyuzhoufm.com/episode/67d2a7cb52a6af799c23479a) 晚点聊 118 期:天生卷王郭人杰:从 97 年的扫地机器人总裁到创业做家庭通用机器人 (https://www.xiaoyuzhoufm.com/episode/68379234661c1af455c9e42c) 晚点聊 122 期:10分钟朱啸虎投资,泡泡玛特、米哈游都在试;Fuzozo孙兆治聊AI潮玩 (https://www.xiaoyuzhoufm.com/episode/67d2a7cb52a6af799c23479a?s=eyJ1IjogIjY1ZGRjOWUyZWRjZTY3MTA0YWUxMWU0YiJ9) 剪辑制作:甜食 小红书@曼祺_火柴Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token=YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw-EfCtqmFTkCIM2o=&xsec_source=app_share&xhsshare=CopyLink&appuid=5dfa9e92000000000100626f&apptime=1736682459&share_id=331aecb9ca7941f498d81fb9c32ea810)即刻@曼祺_火柴Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/%E6%92%AD%E5%AE%A2-%E7%BB%93%E5%B0%BE%E4%BD%9C%E8%80%85%E7%AD%BE%E5%90%8D.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
本期嘉宾,是清华大学的刘知远和肖朝军,他们刚在 11 月的《自然》杂志《机器学习》子刊上发表了封面文章:Densing Law of LLMS,大模型的密度法则。所谓“密度”,就是用更少的算力和数据获得相当乃至更多的智能。 刘知远是清华计算机系副教授和面壁智能首席科学家,肖朝军现在在清华做博士后,也是面壁 MiniCPM 系列的文本模型负责人。 https://pic4.fukit.cn/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20251211/ajP0/1280X699/da0e6f3b-bcb7-44e0-8f3f-48e0e5d66648.png/webp 图注:此图描述了 2023 年 4 月之后,主要开源模型的能力密度的变化。能力密度是衡量单位参数/算力下,模型能力的指标。目前版本的密度法则总结了预训练大语言模型的密度变化,o1、R1 等后训练强化学习对能力密度的提升尚未体现在指标里。 我们讨论了密度法则研究的源起,也展开聊了业界提升模型能力密度的具体做法:如何从架构、数据治理、算法和软硬协同优化 4 个环节着手提升模型能力密度。 而再往后,更大的密度提升,可能需要一些全新方法,因为强化学习的 Scaling Law 还未清晰展现,未来可能有两种技术路线:一是继续扩大强化学习的规模,观察其中是否涌现更多泛化能力;二是寻找新的学习方式。 在刘知远的设想中,未来,更高密度的模型,会支持每个人在端侧的专属模型,智能会分布式存在:也许手机都不是最终的入口,而是一个可以随身携带的个人计算设备:“就像一个可以随身携带的 NAS”。 https://pic4.fukit.cn/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20251211/J3ZV/1080X679/31971587-39a6-4c14-a140-c117c88bcd67.png/webp 图注:达到 GPT-4V 水平的模型参数规模随时间增长迅速缩减,而端侧算力快速增强,当芯片电路密度(摩尔定律)和模型能力密度(密度法则)两条曲线交汇,端侧设备将能运行以往只能在云端运行的大模型。 性能一直是人们更关注的模型演进的脉络,而这期我们会讨论,在另一条主线“效率”上,我们可以做出什么努力。 本期嘉宾: 刘知远,清华大学计算机系副教授、面壁智能首席科学家 肖朝军,清华大学计算机系博士后、面壁智能 MiniCPM 系列文本模型负责人 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -大模型时代的“摩尔定律” 02:09 Gemini 3 和 Nano Banana Pro 的启发:统一的“自回归式视觉+语言生成”即将突破 04:31 大模型演进的两条主线:能力和效率 10:23 和摩尔定律一样,“密度法则”是行业现实,也是“自我实现” 18:43 每 3.5 个月,大模型的能力密度翻一番 21:01 2023 年下半年的抉择:花几千万再训一个更大的模型,然后呢? -提升密度的四个环节 27:08 架构、数据、算法、软硬协同优化 30:41 (1) 架构:MoE (混合专家系统) + 注意力机制改进 34:28 (2) 数据治理:Ultra-FinWeb 用 1/10 数据量达到更好效果 40:24 (3) 算法:RL 还没有 Scaling Law,接下来可能有两条路 49:21 (4) 软硬协同优化 52:02 InfLLM-V2 的核心更新:把稀疏注意力做到预训练阶段 55:18 注意力改进趋势:长文本不仅是长输入,更多关注“长输出” -大模型上车、上手机 58:53 5 年内,手机可跑 GPT-4~5 级别的模型 01:06:23 大模型在汽车上已开始量产落地 01:10:34 “别人得到的,不一定是你失去的”,AGI 既会发生在云端,也会发生在终端 01:15:07 未来入口也许不是手机,而是属于每个人的移动计算终端 -AGI 下一步:自主学习 + 分布式的智能 01:17:40 自主学习→AI 协作网络→真正的创新 01:21:04 2023 年初,有巨头说世界上只会拥有几个大模型,就像 1943 年,IBM 董事长曾说全球不需要超过 5 台主机 01:24:46 AI 助手帮成为更好的工作者 01:28:53 不担心生产过剩,未知领域还太多 01:31:39 机器制造机器,AI 制造 AI 01:40:01 ☆连点成线 相关链接: 晚点聊 143 期:《再聊 Attention:阿里、Kimi 都在用的 DeltaNet 和线性注意力新改进》 (https://www.xiaoyuzhoufm.com/episode/692cd86fe4244f7e3d3ad135) 晚点聊 103 期:《用Attention串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进》 (https://www.xiaoyuzhoufm.com/episode/67bf356952a6af799c558399?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 剪辑制作:Nick 附录,本期提到的一些论文(更多具体名词解释,见本期文字版): Densing law of LLMss (https://www.nature.com/articles/s42256-025-01137-0)(《大模型的密度法则》) Efficient GPT-4V level multimodal large language model for deployment on edge devices (https://www.nature.com/articles/s41467-025-61040-5)(本期中提到的,具身行业喜欢引用的图的原始论文。) InfLLM-V2: Dense-Sparse Switchable Attention for Seamless Short-to-Long Adaptation (https://arxiv.org/abs/2509.24663)(InfLLM 稀疏注意力改进的第二版。) 本期主播: 小红书@曼祺_火柴Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token=YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw-EfCtqmFTkCIM2o=&xsec_source=app_share&xhsshare=CopyLink&appuid=5dfa9e92000000000100626f&apptime=1736682459&share_id=331aecb9ca7941f498d81fb9c32ea810)即刻@曼祺_火柴Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/%E6%92%AD%E5%AE%A2-%E7%BB%93%E5%B0%BE%E4%BD%9C%E8%80%85%E7%AD%BE%E5%90%8D.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
「不仅是提效,线性注意力在数据受限情况下的更多潜力。」 今年初的两期节目(103、104 期)里也讨论过注意力机制,这是大语言模型的核心机制。 9 月 和 10 月,阿里和 Kimi 都发布了相关进展,而且都用到了一个线性注意力成果,DeltaNet。 本期嘉宾,就是 DeltaNet 的核心贡献者之一,现在在 MIT 读博士的杨松琳,她也是线性注意力开源小组 FLA 的发起者。 这期节目在 25 分钟以前很硬核,松琳讲了线性注意力和 DeltaNet 的发展脉络,为何 21 年刚被提出时没引起太多注意,后来怎么进化的。 25 分钟以后,是关注 AI 比较多的文科生,比如我也能完全跟上的部分。我们讨论了,重新去做 full attention 的 MiniMax,以及未来要在旗舰模型上用线性注意力的 Kimi 和阿里的不同选择;线性注意力的优劣势;以及一些脑洞——如果算力无限,还需要线性注意力?松琳给了很有启发的回答。 最后半小时,松琳分享了她作为研究员,怎么习得交叉技能的,怎么开始发起FLA小组等成长经历。 本期嘉宾:杨松琳,MIT 博士生在读,DeltaNet 贡献者 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -DeltaNet 的诞生演进与近期动向 02:07 注意力机制是什么? 04:21 DeltaNet 的提出,用 Delta Rule 来增强 in-context retrieval 09:41 近年的改进主要是模型架构,而非“更新规则” 14:25 阿里 Qwen 团队 apple to apple 比较几种线性注意力混合方式;Kimi Linear 对 Gated Delta 的具体改进 17:00 更新规则和模型架构改进的区别:更新规则是在算子层面“动刀” 19:50 算法出身,自学 Infra;学习 Hazy Research Group 的风格 23:28 Qwen 和 Kimi 大概率在下一代旗舰模型用线性注意力,而 MiniMax 用回 full attention;DeepSeek 目前释放的改进都是“稀疏注意力” 37:07 稀疏注意力 vs 线性注意力潜力对比 39:40 即使算力无限,线性注意力仍有价值,因为它在有限数据中的学习效率更高,而高质量数据正是当前瓶颈 42:28 线性注意力在状态追踪上也可能有效果优势,而状态追踪对 Agentic 很重要 47:33 线性注意力的“归纳偏见”和 The Bitter Lesson:先验与 scalable 并不矛盾 49:30 回应 RWKV(原始智能)彭博:从未说发明 DeltaNet,一直在给 Schmidhuber 署名 -Householder 与 DeltaNet 的联想,像运营产品一样运营技术社区 51:51 关注注意力改进的起点,数学知识、Infra,交叉能力怎么积累? 58:48 发现 Hoseholder 累乘和 DeltaNet 关联的过程 01:02:44 AI 何时能像人这样产生联想?——Prompt 合适,大模型应该能独立发现这个算法 01:04:11 FLA 小组的产生,受 Tri Dao 做 FlashAttention 的启发,像运营产品一样运营技术社区;Kimi 从 FLA 小组招募了线性注意力研究者 -注意力改进的未来趋势 01:11:24 稀疏注意力的改进,DeepSeek 年初 NSA 到最近 DSA 的变化 01:16:44 线性注意力的改进,从线性混合全注意力,到线性混合稀疏注意力(比如混合 DeepSeek DSA 和 Kimi KDA 😀 01:21:10 更广泛来说,关注何种模型演进?——持续学习 相关链接: 图文版:《再谈注意力:阿里、Kimi 都在用的 DeltaNet 和线性注意力新改进丨晚点播客》 (https://mp.weixin.qq.com/s/bjRAqIn9sEVE03dW6ToEEg) 晚点聊 103 期:《用Attention串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进》 (https://www.xiaoyuzhoufm.com/episode/67bf356952a6af799c558399?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 晚点聊 104 期:《我给线性注意力找“金主”,字节 say No,MiniMax say Yes》 (https://www.xiaoyuzhoufm.com/episode/67c63718e24b741ee8e2ee63?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 剪辑制作:Nick 附录,本期提到的一些论文(更多具体名词解释,见本期文字版): Transformers are RNNs: Fast Autoregressive Transformers with Linear Attention (https://arxiv.org/abs/2006.16236) Linear Transformers Are Secretly Fast Weight Programmers (https://arxiv.org/abs/2102.11174) Parallelizing Linear Transformers with the Delta Rule over Sequence Length (https://arxiv.org/abs/2406.06484) Gated Linear Attention Transformers with Hardware-Efficient Training (https://arxiv.org/abs/2312.06635) Recurrence-Complete Frame-based Action Models (https://arxiv.org/abs/2510.06828) 本期主播: 小红书@曼祺_火柴Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token=YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw-EfCtqmFTkCIM2o=&xsec_source=app_share&xhsshare=CopyLink&appuid=5dfa9e92000000000100626f&apptime=1736682459&share_id=331aecb9ca7941f498d81fb9c32ea810)即刻@曼祺_火柴Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/%E6%92%AD%E5%AE%A2-%E7%BB%93%E5%B0%BE%E4%BD%9C%E8%80%85%E7%AD%BE%E5%90%8D.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
教育或许是最难被技术改造的领域,因为它太强调互动、个性化的体验与启发性的反馈,这个过程既难标准化,又无法快速复制。 直到大模型的出现,让人第一次看到了教育被技术大规模改造的可能性。市场上旋即涌现出来的各种五花八门的 AI 教育产品,它们从各种层面试图运用大模型的能力,但也反映出在原理技术到面向市场的商业产品之间,大模型在教育场景的落地还存在着一条难以被清晰描摹的鸿沟。 今天的播客,我们与斑马首席产品官修佳明探讨了这条鸿沟本身,以及斑马逾越它的方式。 基于大模型特点,原生构建的 AI 教育产品应该是什么样的?如何摆脱工具属性,让大模型 Agent 成为一个可以主导教学过程的教育产品?如何设计教学梯度、节奏和目标,既能发挥大模型的主动性,又不让一切偏离教学目的本身?如何让大模型更好理解人类在教学领域积累的各种经验,让它更好实践已被证明有效的各种教学法和教育心理学方法? 对这些问题的回应将决定一款 AI 教学产品的本质,进而决定它的商业化前景。修佳明给出了斑马的回答。 本期节目由 斑马口语 特别支持播出。 本期嘉宾:修佳明,斑马首席产品官 本期主播:申远,晚点 latepost 记者 时间线跳转: -Part1:斑马心中的全栈式 AI 教育产品 04:36 确定性的方向 08:01 与模型“搏斗” 13:58 为什么开发 delay 了? -Part2:主动性 VS 被动型,斑马产品的核心差异 20:56 从维持能力到突破能力 24:08 让大模型学会人的教学经验与教学法 29:36 更难的是对(教学)难度的控制 34:16 这种模式适合所有人吗? 35:54 让 AI 提供一种教学情绪价值 41:38 对 AI 外教人格的理解 -Part3:将 AI 产品推向市场 47:37 试用用户的反馈与规则设定 52:06 如何衡量 AI 的教学能力? 56:28 未来的 AI 教学产品会如何发展 59:22 如何运用数据和经验:斑马的 AI 壁垒在哪里 01:04:05 AI 产品还是教育产品?斑马的付费和定价策略 相关链接: 《主导型教育 Agent 产品,是口语学习的终极答案吗?》 (https://mp.weixin.qq.com/s/OlSnwvQKmu3_4F-7hU5XBQ) 本期主播:申远,晚点 latepost 记者 https://i.ibb.co/pt55jRm/20251121-223803.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
「大家更关注 PMF 的 M(需求),但有时 P(产品)做得足够好,M 就能自动打开。」 “大疆系”正成为创投圈的一股小风潮。2023 年夏天,洪小平创立 Strutt(若创科技),他曾任大疆光电部及激光雷达产品线览沃负责人。 Strutt 的首款产品 ev¹ 即将在明年初正式发售 ,它看起来是一台电动轮椅,而洪小平告诉我,ev¹ 不是一台智能轮椅,“而是一种新的移动出行设备”。这听起来有些抽象,直到我在旧金山遇到了 ev¹ 的用户:双臂残缺,只有两根手指的 Usman;脊椎脆弱的 16岁少女 Ali,和患有多发性硬化症的 Joe。 https://pic4.fukit.cn/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20251124/g8bk/1280X663/b43c77c3-25d6-4a0e-9aaa-71a71c20449a.png/webp 旧金山试用会现场,Scott、Micah 两位 YouTube 博主和 Usman 坐着 ev¹ 比赛,看谁先到达车道末端。(这张照片里就有两台 Insta360 X 系列全景相机,现场也有好几台大疆 Pocket 3。) 我更多感受到的他们与我们的相同。他们不仅想要基础保障,也想要更好的生命体验。科技爱好者 Usman 戴着 Apple Watch 和 Ray-ban Meta,他曾用 Vision Pro 操控 ev¹;Ali 给轮椅编织了花朵;Joe 那天分享了很多他年轻时旅行和玩帆船的旧照片。他们渴望的不是另一台轮椅,而是减少出行顾虑,能去更多地方的自由。 我自己也两次试用了 ev¹,Copilot+ 模式的驾驶体验对我来说也很有趣。洪小平设想,在大型公园、机场等区域,更多人可能都需要 ev¹ 这样的设备。 本期,这位曾经在伯克利研究纳米材料的物理学博士,分享了他在大疆,如何从研究者转型为业务负责人;以及创业两年半以来,组建团队,开发产品、做减法的历程。 本期访谈的图文版:《大疆览沃前负责人洪小平创业:我做的不是一台电动轮椅》 (https://mp.weixin.qq.com/s/HRP3mKrFK7MA2O_4S8ntJw) 本期嘉宾:洪小平,Strutt 创始人兼 CEO 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -投资人总问:为什么你们不做人形机器人? 02:07 伯克利物理学博士→组建大疆光电部:奔着量产做激光雷达 08:26 大疆→南方科技大学:新工科教育 & 思考创业,锁定「机器人」方向 14:03 直接做人形机器人和具身“终极形态”,是“有方法、没路径” 18:04 OpenAI 加大投入 LLM 时,已有早期信,具身没到这个状态;识别早期信号的核心是数据积累 22:43 看到“老龄化”去收,就是它了! 25:13 个人移动设备能获得宝贵的家庭、生活场景数据 -ev¹ 的诞生,它不是电动轮椅 29:28 ev¹ 是泛个人出行设备,它的完整体验 35:07 出行的自由和喜悦,不分健康或残疾、衰老或年轻 41:13 大家更关注 PMF 的 M(需求),但有时 P(产品)做得足够好,M 就能自动打开 43:26 ev¹ 的开发,从做加法到做减法 47:51 观察用户说不出来的需求; 51:19 ev¹ 也是一个 Robot Helper 和机器人平台:可加传感器、执行器、计算单元等配件 56:50 在双滚机上做 200 万圈测试 58:33 “产品真正帮到人”的感觉,很触动 01:00:54 Go to Market 策略:定价、渠道、规模 -什么是一个好团队?大疆怎么又极致,又“舒适”? 01:03:55 创业,从“定义一个好团队”开始 01:07:25 大疆的“舒适”:技术说话、以结果论英雄、可以专注自己的事 01:12:35 应对未来可能的竞争:品牌、专利布局、团队综合性,本质是团队效率 01:19:33 消费科技公司,在高效 vs 速度上的分布:追觅、Insta360、大疆 01:22:39 为什么大疆到 2019 年才定成文价值观? 01:24:43 Next Question:跨越鸿沟——ev¹ 这样的产品怎么进入大众市场? 01:28:06 连点成线:往期推荐 附(播客中提到的部分术语、人物的表达可见图文版,如 VLA、PaLM-E、RT-2、吴景深等,以下摘录文字版中没提及的部分): 王铭钰:汝原科技创始人,大疆前研发副总裁,主导多款旗舰无人机的工程体系建设。(节目中提到的邀请洪小平加入大疆的港科本科同学) 魏基栋:松灵机器人创始人兼 CEO,大疆 Robomaster 业务的一号员工和联创,2016 年创业;库犸智能割草机即由松灵推出。 拓竹:一家 3D 打印机公司,旗下也有 WorldMaker 3D 模型共享平台;由陶冶创立,他曾任大疆动力系统部门经理、Mavic pro 产品经理、大疆消费级无人机事业部负责人。 Invacare:美国医疗辅助设备公司,以轮椅、助行器等康复产品为主营(节目中提及的已退市的行业公司)。 肖文龙:Strutt 联创,大疆早期动力系统技术负责人。 大疆 Inspire 产品线:定位于“专业级航拍/影视器材”的无人机序列,是航拍行业的主力设备与标杆产品。 张富:香港大学 工程学院机械工程系副教授,研究方向为激光雷达-惯性/视觉融合 SLAM 算法。 激光雷达 SLAM 算法:基于激光雷达点云定位与建图的算法,让机器人在未知环境中自行导航。 相关链接: 晚点聊 120 期:《科创板后再访Insta360刘靖康:这何尝不是一种极限运动!》 (https://www.xiaoyuzhoufm.com/episode/684b3febcdecf72d4cb70f82) 晚点聊 118 期:《天生卷王郭人杰:从 97 年的扫地机器人总裁到创业做家庭通用机器人》 (https://www.xiaoyuzhoufm.com/episode/68379234661c1af455c9e42c) 晚点聊 87 期:《家里又多了个“怪东西”!与云鲸聊新消费电子品的诞生》 (https://www.xiaoyuzhoufm.com/episode/6722bab9602cbdd915a3fbdb?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 剪辑制作:甜食 本期主播: 小红书@曼祺_火柴Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token=YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw-EfCtqmFTkCIM2o=&xsec_source=app_share&xhsshare=CopyLink&appuid=5dfa9e92000000000100626f&apptime=1736682459&share_id=331aecb9ca7941f498d81fb9c32ea810)即刻@曼祺_火柴Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/%E6%92%AD%E5%AE%A2-%E7%BB%93%E5%B0%BE%E4%BD%9C%E8%80%85%E7%AD%BE%E5%90%8D.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
「从物理的黄金时代到 AI 的黄金时代。」 大模型热潮正在深入一个硬核领域:AI for Science,用 AI 加速科学发现。由斯坦福大学前校长参与创立的 AI for Science 公司 Xaira Therapeutics,去年一启动就募资超 10 亿美元;OpenAI 也在今年成立“OpenAI for Science”部门,刚在上个月雇了一位黑洞理论物理学家。 早在 6 年多前,中国的 AI for Science 创业实践已经开始。最适合讲述这个故事的是张林峰和孙伟杰。 2018 年,25 岁的他们创立深势科技。 2022 年 3 月,张林峰写文:《AI for Science 2022:未来已来,即将开始流行》https://mp.weixin.qq.com/s/xhGVSY5jBqVMiXrdSKgdcQ 。8个月后,ChatGPT 才发布。 深势的起点,是用 AI 加速求解量子物理中的“第一性原理计算”,即求解“薛定谔方程”等一系列基础量子物理方程。这是量子论和 AI,跨越百年的两个黄金时代的相遇。 1993 年出生的张林峰来自山西汾阳,因参加物理竞赛保送北大。在定位于跨学科教育的元培学院,他同时修了物理、数学、计算机。与张林峰同龄的孙伟杰来自佳木斯,主修政经哲。两个北方高个儿男孩是院篮球队、羽毛球队队友,也在元培学生会体育部搭档。 https://pic4.fukit.cn/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20251110/PYHg/1280X922/acb30997-d89e-40de-9634-32ec595e6d06.jpeg/webp 大二时,元培体育部举办趣味羽毛球赛后,孙伟杰(左)和张林峰(右)从邱德拔体育馆骑车回宿舍。 6 年多来,深势科技推出了 Hermite 药物计算设计平台、Piloteye 能源电池研发平台;以及一系列预训练科学模型,如分子大模型 Uni-Mol、实验表征大模型 Uni-AIMS 、蛋白质大模型 Uni-Fold、基因大模型 Uni-RNA 等;科学文献大模型 Uni-SMART;和综合这些积累的科研平台与科研 Agent,“玻尔科研空间站” 和 SciMaster;服务了宁德时代、比亚迪、多氟多、长安汽车、京东方、东阳光药、人福医药、诺泰生物等企业客户。 本次访谈,我们与张林峰、孙伟杰一起回顾了他们亲历的 AI for Science 从开始到现在的发展脉络,深势科技在有限资源下经历的焦灼、抉择,和他们在科研平台与垂直应用间的取舍。 多年前,杨振宁曾在一次高能物理学术讨论会上说:“The party is over”,上一个物理大发现的时代已然远去。大三时,张林峰一度迷茫:“我们这一代希望从底层科学出发做点儿事的同学,都缺点儿让人兴奋的大问题。” 现在,派对又开始了。 本期访谈的图文版:__ 《对话深势科技张林峰、孙伟杰:AI for Science,从开始到现在》 (https://mp.weixin.qq.com/s/W1c24vLKcjoNlhPdyVv0QA) **本次访谈之后也会发布视频版,可在抖音、B站、小红书、微信视频号搜索“晚点聊”或“晚点”观看。* https://pic4.fukit.cn/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20251110/d0Bt/2098X1156/WechatIMG814.jpg/webp 本期嘉宾: 张林峰,深势科技创始人兼首席科学家 孙伟杰,深势科技创始人兼 CEO 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -起点:用 AI 加速“第一性原理计算” 01:32 93 年生人学物理,the party is over 的迷茫 08:42 用 AI 加速第一性原理计算:薛定谔方程、密度泛函、分子动力学 -提出 DeePMD:从“两亿核时”到“笔记本跑半小时” 21:31 第一个 milestone:用一套统一方法表示多种“不变性” 26:27 普林 2017 年的 200 多块 P100→DeePMD-kit→DeepModeling 开源社区 29:51 AlphaFold 和 DeePMD,AI 做科研的两种方式 -起步的 5 年:是公司,也是“大学” 32:38 毕业、回国、创业:机会是 AI for Science,不是 get simulation done 然后发论文 42:06 做微尺度的“达索系统”,把量子物理软件化 56:14 人才培养:在 DP “读大学”的少年们 -从机器学习到 Agent,AI 科学家,AI for Science 的五个阶段 01:04:37 机器学习数理建模→预训练→大语言模型→科研 Agent→AI 科学家 01:16:20 Agent 正在重塑科研范式 01:22:46 “科研无国界”被挑战,在中国,更能推动开源、开放 01:29:00 垂直还是平台,一个必须做的取舍 01:32:57 诺奖表彰“第一个”,而基础平台要做“最后一个” 01:39:24 我们为 AI 科学家做好准备了吗? -热血少年、沙漠流浪、灌篮高手 01:49:13 欲望与勇气,《牧羊少年的奇幻之旅》 01:55:33 “老爹,你最光辉的时候是什么时候?”“就是现在!” 01:57:21 “理想主义的实干者才能改变世界” 01:57:59 Next Question:Innovator 什么样?第一批 AI 发现的新成果 02:04:04 连点成线:不约而同,我们在好多期节目里都聊到了 AI 加速科学发现 相关链接: 张林峰:《AI for Science 2022:未来已来,即将开始流行》 (https://mp.weixin.qq.com/s/xhGVSY5jBqVMiXrdSKgdcQ) 张林峰:《在PD“读大学”的少年们》 (https://mp.weixin.qq.com/s/MuTfXLL9Wrl9FOWo9QjfJg) 晚点聊 116 期:《当AI研究者写科幻,与Meta田渊栋聊他的智能想象:我们终会“所思即所得”》 (https://www.xiaoyuzhoufm.com/episode/682896c716fbd45594de128c?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 晚点聊 103 期:《用Attention串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进》 (https://www.xiaoyuzhoufm.com/episode/67bf356952a6af799c558399?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 晚点聊 101 期:《与王小川聊AI✖️医疗:通向“生命科学的数学原理”》 (https://www.xiaoyuzhoufm.com/episode/67aaefa541b8e4a63c93c03d?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 附:本期节目中出现的术语、人物、公司 鄂维南:应用数学家,中国科学院院士,张林峰在普林斯顿的博士生导师之一;主攻多尺度建模与机器学习在物理系统中的应用。 黎曼几何:研究带曲率空间的几何结构,是广义相对论数学语言的核心,由黎曼在 1850 年代提出。 古典微分几何:研究曲线和曲面的局部几何性质,是现代几何的基础框架,成熟于 1820 年代。 弦论:把“点粒子”换成一维弦来描述宇宙的高能物理理论,试图统一量子力学与引力。 冯济:北京大学量子材料科学中心,博雅特聘教授;罗纳德·霍夫曼的学生。 罗纳德·霍夫曼(Roald Hoffmann):诺贝尔化学奖得主,以理论化学和化学键研究著称。 邓肯·霍尔丹(Duncan Haldane):诺贝尔物理学奖得主,因拓扑量子物态理论贡献而闻名。 罗伯特·卡尔(Roberto Car):计算化学家,张林峰在普林斯顿的博士生导师之一,Car–Parrinello 方法共同提出者。 Michele Parrinello(米歇尔·帕里内洛):Car–Parrinello 方法的共同提出者。 Ab intio Molecular Dynamics 从头算分子动力学方程 :Roberto Car 和 Michele Parrinello 在 1985 年发表了论文(Unified Approach for Molecular Dynamics and Density-Functional Theory(《分子动力学和密度泛函理论的统一方法》),提出了Car-Parrinello 分子动力学方法。 薛定谔方程:量子力学的根本方程,描述微观粒子的波函数随时间如何演化。 波函数:在量子力学中刻画系统全部信息的数学对象,其平方给出概率密度。 密度泛函方程:密度泛函理论中的基本方程,通过电子密度而不是波函数求体系能量。 王涵:北京应用物理与计算数学研究所科学家,Deep Potential 的合作者之一 Deep Potential Molecular Dynamics(DeePMD 深度势能分子动力学:深势团队提出的深度势能模型方法,基于神经网络学习原子间相互作用。 DeePMD-kit:DeePMD 方法的开源软件套件,用于训练势能模型并进行分子动力学模拟。 DeepModeling:围绕物质模拟的开源生态,包括 DeePMD 在内的工具集。 汤超:物理学家、生物物理与复杂系统研究者,在理论物理与系统生物学有影响力。2018 年与鄂维南在学术研讨会中一起提出 AI for Science。 薛定谔公司(Schrödinger):成立于 1990 年,从计算化学软件起步,后来扩展到药物发现平台。 Accelrys(现 Dassault BIOVIA):成立于 2001 年(由 Molecular Simulations Inc. 等合并而来),在 2014 年被达索系统收购并更名为 BIOVIA。 达索系统(Dassault Systèmes):成立于 1981 年,最早做 3D 设计与仿真软件(CATIA),后来扩展到材料、生物、制造等全栈建模平台。 玻尔科研空间站:深势团队打造的 AI for Science 计算科学平台。 SciMaster:深势科技 2025 年夏天推出的科研智能体 Uni-Mol:用于分子结构与药物发现任务的通用深度学习模型。 Uni-RNA:使用深度学习处理 RNA 结构与设计任务的模型体系。 Evo 2:2025 年 2 月,由 Arc 研究所、斯坦福、英伟达合作推出的生物分子科学基础模型。 AlphaGenome:2025 年 6 月 DeepMind 发布的一款能解读基因组功能和预测变异效应的模型。 Future House:2023 年 Google 前 CEO 埃里克·施密特支持成立的 AI for Science 公司,主攻新材料、新药研发和 AI 驱动实验。 剪辑制作:Nick 本期主播: 小红书@曼祺_火柴Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token=YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw-EfCtqmFTkCIM2o=&xsec_source=app_share&xhsshare=CopyLink&appuid=5dfa9e92000000000100626f&apptime=1736682459&share_id=331aecb9ca7941f498d81fb9c32ea810)即刻@曼祺_火柴Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/%E6%92%AD%E5%AE%A2-%E7%BB%93%E5%B0%BE%E4%BD%9C%E8%80%85%E7%AD%BE%E5%90%8D.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
「从模型驱动到垂直整合:Gaga-1 是第一个产物。」 https://pic4.fukit.cn/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20251029/x7Fp/1280X910/1280X1280.PNG/webp 图注:飞书“智能会议纪要”功能为本次播客生成的概要图。 本期节目由飞书特别支持播出!欢迎大家尝试“智能会议纪要”(https://www.feishu.cn/product/ai-meeting-summary?hideHeader=1&utm_from=latetalk),功能,点击前文晚点转述链接,可申请 1 个月免费使用。 2024 年初,刚听说曹越开始新一次创业时,我就找他聊过一次。那时他有一个吸引科技报道者的标签:光年之外联创。 今年 10 月的这次正式访谈中,我有点儿理解了为什么王慧文在 2023 年初见了那么多研究者后,会选择曹越来做技术合伙人——曹越是少数在 ChatGPT 之前,预判到大模型热潮的中国研究者。2021 年,他拿下 ICCV 最佳论文后,离开了微软亚研院,加入了国内最早做大模型的机构,智源研究院。 让我稍感意外的是,曹越做研究员时,就格外关注组织与机制;2021 年,在看到 DALL-E 和 CLIP 后,他开始研究 OpenAI 是怎么协作的,这也是他加入智源的原因之一。 这期节目,曹越回顾了他在清华读本科时,如何看到深度学习,那篇 ICCV 最佳论文的诞生;他从研究员到创业者的转变;对 Sora 的观察,以及 Sand.ai 打造新一代模型 Gaga-1 的思考与实践。 通过学习 OpenAI 等全球顶尖公司,更重要的是通过自己的实践和反馈,曹越现在的认知是,要做一个垂直整合的“端到端”的组织,更好平衡模型进展与从需求出发,10 月中旬 Sand.ai 新发布的模型 Gaga-1 (https://gaga.art/zh/app) 就是垂直整合的产物。它聚焦解决人物表演问题,“人物不一致、表演假”,是许多试图使用 AI 的内容制作者之前最大的痛点。 https://pic4.fukit.cn/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20251030/SWoh/2900X1580/%E6%88%AA%E5%B1%8F2025-10-30_13.48.34.png/webp 图注:在 Gaga AI 网站 (https://gaga.art/zh/app) 上,现在可体验音画同出、聚焦人物表演能力的视频生成 在技术驱动的 AI 创业时代,一个模型出身的创始人,如何判断趋势,又怎么学习做 CEO?曹越分享了他的探索和体验。 本期嘉宾:曹越,Sand.ai 创始人兼 CEO 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 https://pic4.fukit.cn/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20251030/B0yw/1655X862/%E6%88%AA%E5%B1%8F2025-10-30_23.09.22.png/webp **本期播客也有视频版,可在抖音、B站、小红书、视频号搜索《晚点 LatePost》观看。* 时间线跳转: -从 ICCV 最佳论文到研究 OpenAI 组织力:设计一个系统,最大化压榨算力 02:08 2014 年转向深度学习 03:37 在微软亚研院学到的-1:关注最重要、且有提升空间的 topic 05:09 Swin Transfomer 的诞生,Transformer 被引入视觉任务的两个阶段 11:15 在微软亚研院学到的-2:判断 topic 还不够,得以足够资源做出极致效果 13:02 CLIP、DALL·E 冲击:OpenAI 不是论文驱动,而是设计一个系统,最大化压榨算力 18:10 从 GPT-3 到 ChatGPT,3 年疫情阻隔使 OpenAI 巨变被忽略 -中国为什么没有出现 OpenAI 这样的组织?王慧文说是“不够富” 21:30 和王慧文、梁文锋聊;他们都在 23 年初遍历国内研究者 26:57 问老王:为什么中国没有出现 OpenAI?——“不够富” 32:54 光年之外的经验:一开始就确立了正确的“找人方法论” 34:36 CEO 容易焦虑,这时可以想想大问题 -“真的了解创业后,突然感觉什么都对了” 37:16 23 年 8 月开始思考创业:视频生成让自己兴奋 40:54 创业前的自我觉察:ambitious 46:59 第一个模型 Magi-1 花了 1 年多:低估了自回归路线的难度 50:23 正在发生的业务窗口是“音画同出” -“Sora 2 是一个端到端的模型,OpenAI 是一个端到端的组织” 52:36 Sora 2 的 3 个特点,第三点最让曹越惊艳 58:23 Sora 2 怎么实现“端到端叙事”的? 01:03:58 Vibes vs Sora,Meta 是缝合,OpenAI 是整合 -Gaga-1:从需求出发,优先解决人物表演 01:06:53 新模型 Gaga-1 聚焦人物表演,成本大幅下降 01:10:33 用 AI 做短剧,卡点正在人物表演和成本;Sora 的新启发是叙事 01:15:27 需求分析:短剧制作、广告片、C 端斗视频 01:19:42 Sora 能否成为 C 端新平台?曹越的两个判断指标 -垂直整合组织的核心就是:不同背景的人,能对齐上下文 01:23:10 PMF 一直讲,一直难:因为模型和产品的磨合就是要花时间 01:28:07 垂直整合:不同背景的人频繁交流,对齐上下文 01:31:16 再看“模型即产品”:早期产品跟着模型走,现在要互相放大 -成为 CEO 01:38:41 一个“专业”的 CEO 01:42:04 “Gemini 老师”的最大作用是对齐上下文 01:50:27 所有内容的终局都是“叙事” 01:52:29 老王的建议:研究皮克斯商业模式 01:56:06 研究者和 CEO 的“夹角” 01:58:24 最优先级的工作 02:01:01 Next Question:ASI 到来后会怎样 02:03:12 连点成线:往期推荐 相关链接: 图文版:《对话曹越:马尔奖、光年之外、Sand.ai,研究员到 CEO 的十年串起大模型变迁》 (https://mp.weixin.qq.com/s/RvQhgYp530WBLBwrA-DGaw) 晚点聊 136:《Sora新世界 & Lovart 4个月复盘 | 与陈冕聊怎么做垂类Agent|Agent#5》 (https://www.xiaoyuzhoufm.com/episode/68e82298b97d3bce02b4f815?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 晚点聊 58:《光年之外联创再出发,与袁进辉聊 AI Infra 到底做什么?》 (https://www.xiaoyuzhoufm.com/episode/65b19c9bc2bedd4be809a48a?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 晚点聊 39:《从美团收购光年之外,聊聊科技公司收并购的操作与故事》 (https://www.xiaoyuzhoufm.com/episode/64ac929e4367d869a6b86e2f?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 附录: CNN(卷积神经网络):由 Yann LeCun(杨立昆) 等人在 1989 年提出,用于从图像等网格数据中提取局部特征,是深度学习在计算机视觉领域的基础架构。 Transformer:由 Google Brain 在 2017 年 提出,用“自注意力机制”替代循环结构,实现了高效的并行训练,成为目前大模型的核心架构。 iGPT(Image GPT):由 OpenAI 在 2020 年提出,将 GPT 语言建模思想用于图像像素预测,验证了 Transformer 可用于视觉生成任务。 ViT(Vision Transformer):由 Google Research 在 2020 年提出,将图像分割为小块后输入 Transformer,首次在大规模数据上超越 CNN 的图像识别性能。 Swin Transformer:由微软亚洲研究院刘泽、曹越等人在 2021 年提出,通过“层次化窗口注意力”结构改进 ViT,使 Transformer 能高效处理不同尺度的视觉任务。 DALL·E:由 OpenAI 在 2021 年 发布,将 GPT-3 与图像生成结合,可根据文字生成符合语义的图像。 CLIP:由 OpenAI 在 2021 年提出,通过大规模图文对比学习,实现文本与图像的语义对齐,是后续多模态系统的基础模型之一。 Instruct-GPT:由 OpenAI 在 2022 年 发布,通过基于人类反馈的强化学习(RLHF)让 GPT-3 更好理解指令,是 ChatGPT 产品化的重要前提。 剪辑制作:甜食 本期主播: 小红书@曼祺_火柴Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token=YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw-EfCtqmFTkCIM2o=&xsec_source=app_share&xhsshare=CopyLink&appuid=5dfa9e92000000000100626f&apptime=1736682459&share_id=331aecb9ca7941f498d81fb9c32ea810)即刻@曼祺_火柴Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/%E6%92%AD%E5%AE%A2-%E7%BB%93%E5%B0%BE%E4%BD%9C%E8%80%85%E7%AD%BE%E5%90%8D.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
在130 期节目中,我们聊了智谱这样的大模型公司怎么做手机 Agent。本期,我们换一个视角,邀请了 OPPO ColorOS 智能助理部总经理万玉龙博士来分享,手机公司怎么构建和思考移动端的 AI 体验。 作为最主流、最有想象力的智能硬件载体,手机是 AI 入口的必争之地。从苹果、三星、 Google 这样的手机主流厂商和系统级厂商,到掌握超级 APP 的互联网大公司,大家都想抓住这个机会来塑造消费者与 AI 接触的新入口。 在中国市场, OPPO AI 的小布助手是最早一批落地、用户规模也最大的手机智能助手之一,目前月活已超过 1.7 亿。 https://pic4.fukit.cn/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20251023/q1xr/1918X1279/0d8634eb207847d19a4d41b1b0b7ae7c.png/webp 图注:万玉龙在 2025 OPPO 开发者大会上演讲。 在 2025 年 OPPO 开发者大会之前,我们与万玉龙博士一起讨论了 AI 与手机的结合已经发展到了什么阶段,它接下来会如何重塑这个领域的商业格局和应用服务生态,以及它会如何影响我们的工作与生活。 https://pic4.fukit.cn/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20251023/Dsm9/1920X1080/1023-Fv10-sp.mp4_235385.png/webp 本期节目有视频版,可在抖音、B站、视频号、小红书等平台搜索《晚点》观看。 本期节目由 OPPO 支持播出。 本期嘉宾:万玉龙,OPPO ColorOS 智能助理部总经理 本期主播:程曼祺,晚点latepost 科技报道负责人 时间线跳转: -Part 1:手机公司做 AI:新计算、新感知、新生态 01:10 OPPO AI 的新体验 11:56 全球行业共性和 OPPO 特点 20:00 手机 AI 智能助手渗透率低于预期,why? -Part 2:OPPO 的 AI 实践 31:12 厘清三大场景:生产力、生活、影像 38:17 原点之旅访谈用户的细致发现 41:36 以前的产品是 by design,AI 产品是 by use 47:59 AI 现在还不能帮卖手机,但能增加粘性 52:32 AI 人才加入 OPPO:你想做一个影响上亿人的产品吗? -Part 3:未来端侧 AI 生态推演 59:40 三类公司的端侧 AI 竞合 01:04:40 体系重塑中:当用户通过 Agent 来使用 App,日活、时长等指标都被重塑 01:11:27 Web 端有 MCP,移动端呢? 01:13:39 用户不会有一堆“AI 管家” 01:20:46 新交互正快速发展,新应用生态还未定型 01:25:02 Next Question:更成熟的 AIOS 长什么样? 01:31:22 连点成线:过往节目推荐 相关链接: 图文版:晚点聊 130:《手机Agent大幕拉开!从刚上线的AutoGLM 2.0聊起,大模型如何改造手机|Agent#4》 (https://www.xiaoyuzhoufm.com/episode/68a6546b7357a4b631fe8cd3?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 晚点聊 110:《与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专|Agent#2》 (https://www.xiaoyuzhoufm.com/episode/67fd8cafcc06f8ff48a73642?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 剪辑制作:XH&SU 本期主播: 小红书@曼祺_火柴Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token=YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw-EfCtqmFTkCIM2o=&xsec_source=app_share&xhsshare=CopyLink&appuid=5dfa9e92000000000100626f&apptime=1736682459&share_id=331aecb9ca7941f498d81fb9c32ea810)即刻@曼祺_火柴Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/%E6%92%AD%E5%AE%A2-%E7%BB%93%E5%B0%BE%E4%BD%9C%E8%80%85%E7%AD%BE%E5%90%8D.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
「《晚点聊》✖️ AGI House 第一次聊,之后会陆续更新硅谷的 AI 新趋势。」 本期,我们邀请了两位常驻硅谷的朋友,AGI house 的 Henry Yin 和 Naomi Xia,来一起聊 Agent 工具链(Agentic Tooling)的发展趋势,和这个领域在美国的创业实践。 AGI House (https://agihouse.org/) 是一个 2023 年开始运营的 AI 创业和投资社区,连接了Andrej Karpathy( OpenAI 联创、Eureka Labs 创始人 )、 Google 创始人 Sergey Brin、Google AI 负责人 Jeff Dean、Anthropic 联创 Ben Mann 等 AI 从业者。 https://s.fukit.cn/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20251017/DOAY/1706X960/WechatIMG172.jpg/webp 图注:刚刚在 AGI House 组织的技术活动:与 Open AI 论文作者的 technical paper reading event。 Henry Yin 毕业于清华姚班,后前往伯克利攻读博士,期间退学创办思码逸(Merico),用 AI 提升开发者效率,长期关注 Agent 工具链与应用层创新。 Naomi Xia 毕业于沃顿商学院,曾任职于摩根大通 AI 投融资团队,现在负责 AGI House 早期投资,已投资 20 多家公司,如本期提及的 Composio、Livekit 等。 我们第一次录制是在十一前,而假期中的 10 月 6 日,OpenAI 举办了第三次 DevDay,即开发者日。发布了一系列与 Agent 相关的新工具,包括 AgentKit、Evals 等。这次 OpenAI 也带来了 Apps in ChatGPT 和 Apps SDK,这是 ChatGPT 试图变成操作系统的再一次尝试。 本期节目由此分为两部分: - 第一部分,我们讨论了刚结束的 DevDay 的亮点; - 第二部分,则是对 Agentic Tooling,即 Agent 工具链的发展脉络和当前热门环节的梳理。 这一次是《晚点聊》与 AGI house 两位第一次录制。之后我们会定期邀请 AGI House 团队及其社区连接的成员分享在美国 AI 最核心的区域的新变化。 本期嘉宾: Henry Yin:AGI House 联创 & CTO,LinkedIn @Henry Yin (https://www.linkedin.com/in/henry-yin-88116a52?utm_source=share&utm_campaign=share_via&utm_content=profile&utm_medium=ios_app) Naomi Xia:AGI House 合伙人 & 投资负责人,LinkedIn @Naomi Xia (https://www.linkedin.com/in/naomi-yue-xia/?utm_source=share&utm_campaign=share_via&utm_content=profile&utm_medium=ios_app) 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -OpenAI 开发者日 03:30 Agentic Kit 是 OpenAI 开放了自己练的“一身武功” 09:06 Apps in ChatGPT 和 2023 年 GPTs 的区别 10:53 Canva in ChatGPT 新体验 14:47 OpenAI 不会放弃 to B 18:16 一种批评,AgenticKit 与 AGI 思路背道而驰 21:15 开发者的机会与压力:在别人的地基上建房子 -Agentic Tooling 的 6 次进化 26:33 Agentic Tooling 是什么?近期 3 笔交易/收购看到的状态 31:24 Agentic Tooling 的 6 次进化,对应模型能力的 6 次提升 -当下环节梳理 工具调用 39:59 MCP Server 集成商是做什么? 43:09 当前调用 MCP Server 的数量限制,创造 Rube 等产品的机会 44:18 Composio,一家从印度来美国的公司,怎么从 Agent 厂商转型 MCP server 服务商 49:09 这真是创业机会吗?为何 Anthropic 自己不做? Voice 53:09 911 也在用的 AI voice 平台 57:25 从 LiveKit 平台看到的调用偏好:Speech to Speech(语音端到端)和 Cascade 模型现在一半一半 59:28 OpenAI 等核心 Lab 的 Voice 动作 记忆 01:01:57 四种记忆:情景、流程、事实/知识、人格/性格 01:04:26 创业案例:Letta,记忆也可以由第三方来做吗? 01:10:29 记忆和上下文工程 评估 01:11:50 一个重要,但很多人不好好做的环节 01:14:07 评估难,难在构造数据集 -2000-5000 亿的工具生态市场 01:15:27 Okta、Twilio、DataDog 都可以在 AI 时代“再做一遍” 01:21:23 2025 年,“闯美”中国 AI 创业公司变多,它们带来了不一样的野心 相关链接: 图文版:《OpenAI、Google、Anthropic 都在做的 “Agent 工具箱” 是什么丨晚点播客》 (https://mp.weixin.qq.com/s/u33843PaHJOcqcGEvAw2Fg) 晚点聊 129:《中国AI founder如何直接在美国创业? | 对话FinalRound创始人Michael》 (https://www.xiaoyuzhoufm.com/episode/689d4f24b85e0f89684a2cfe?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 附:本期播客里提及的人、公司和具体领域 Merico(思码逸):代码质量、产能分析与工程数据平台,由 Henry Yin 在博士期间联合创立 Andrej Karpathy:OpenAI 联创、Eureka Labs 创始人 Ben Mann:Anthropic 联创 MCP 协议:让大模型能调用各种工具的协议,由 Anthropic 于 2024 年 11 月开源 MCP server:把数据和工具按 MCP 协议做成 AI 可直接调用的服务端 Composio:MCP server 市场,开发者在这个平台上能选择不同 MCP server 以调用工具、完成应用 LiveKit:基于WebRTC(实时通信)的开源音视频通话框架提供商 声网(Agora):实时音视频基础设施提供商 LightSpeed:美国 VC 光速创投,Composio A 轮的领投方 Letta:一家开源 AI 代理框架公司,为智能体研发长期记忆 身份认证:为软件产品或服务提供用户与权限管理服务的 to B 环节 Okta:一家身份认证与访问管理提供商 Twilio:通信云平台公司,开发者可通过 Twilio 平台上的 API 调用短信、语音、视频等通信功能 Observability:为软件开发提供状态或数据的观测/监控服务的 to B 环节 Datadog:Observability 领域上市公司,为应用提供服务器、数据库等监控服务, Braintrust:一家为 AI 应用提供 evaluation(评估)、observability(可观测性/监控)和 trace 分析等工具的创业公司 剪辑制作:Nick 本期主播: 小红书@曼祺_火柴Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token=YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw-EfCtqmFTkCIM2o=&xsec_source=app_share&xhsshare=CopyLink&appuid=5dfa9e92000000000100626f&apptime=1736682459&share_id=331aecb9ca7941f498d81fb9c32ea810)即刻@曼祺_火柴Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/%E6%92%AD%E5%AE%A2-%E7%BB%93%E5%B0%BE%E4%BD%9C%E8%80%85%E7%AD%BE%E5%90%8D.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
「不焦虑的团队,做不好 AI 创业。」 5 月内测、7 月公开上线,设计类 Agent Lovart (https://www.lovart.ai/zh) 诞生 4 个月,做到了 20 万日活用户和 3000 万美元的年度预测订阅收入。 9 月底,我与在在旧金山呆了 3 个多月,回国不久的 Lovart 创始人陈冕,聊了他对垂类 Agent 的思考和实践。在 5 月 Lovart 刚上线时,我们有过一次交流。几个月后,这位创始人和 Lovart 这个产品又经历了快速的迭代,Lovart 几乎总能在第一时间接入 Nano Banana 等最新模型,也推出了受好评的 ChatCanvas 等新交互方式,他也在节目中聊了马上会发布的 context 新能力。 https://edgeone.51shazhu.com/autoupload/OASkVQNlBH2q2HBOsJa6JQ/20251009/qXBc/2382X1414/%E6%88%AA%E5%B1%8F2025-10-09_22.35.13.png/webp 陈冕说,快源于他的焦虑。但现在也需要焦虑,因为技术正快速进化: 就在我们这次聊的几天后,OpenAI 发布 Sora app,展现了消费端 AI to C 超级应用的潜力。我们于是在假期里补充聊了他使用 Sora 的感受和接下来可能的行业变化。作为一位产品经理出身的创业者,陈冕对 Sora 有独特的观察。 本期节目分为两部分,一是 “Sora 打开的新世界”,二是陈冕对 Lovart 上线以来的复盘。 “你往往在觉得你短期可能有点高估它(模型和技术进展)的时候,过两天你又发现你低估了它。”陈冕说。这是让如今的 AI 创业者头疼的地方,这也是让他们快乐的地方。 本期嘉宾:陈冕,Lovart 创始人 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -Sora 打开新世界:这不是社交吗? 01:50 4 个小时使用体验:顺滑、Cameo 的社交潜力、Remix 降低共创门槛;“最好的交互不会超过滑动和点击” 10:58 中等体量的公司,可以通过交互创新做出 Sora 吗? 13:17 “虚假的真实”和“真实的虚假”可能同时存在 14:46 巨头战场:无法接受错过,赢下的意义又太大 19:39 OpenAI 的双面性:巨头的资源,创业公司的组织 21:17 风险可能来自节奏错配:技术加速发展,而总有些事无法被加速 -20 万活跃用户、3000 万美元年度预测收入;服务“everyone who wants to create” 24:23 在湾区,反复被问热情,更想清楚了应该服务谁 30:27 旧金山 3 个月:感受氛围、建立团队、离用户更近 41:50 引入全球化投资的节奏? 44:37 20 万日活用户,3000 万 ARR,还没有覆盖服务成本,但不怀疑 Agent 商业模式 -“提前描绘出未来会发生的东西,然后等它发生” 49:06 创业之初看到了 5 个方向,为何从 “Adobe 系”切入? 02:43 垂直 AI 应用本质在做两件事:特别的交互,和特别的 context 57:34 应用公司怎么做增长?“提前描绘未来会发生的东西,然后等它发生” 01:06:00 正在做的能力:给设计更多 context,这包括 reference 和 preference 01:13:43 Lovart 到目前为止是工具,没有计划做社区 01:16:25 离用户更近,同时离技术更近,然后才能做取舍 01:22:51 为什么不再担心开源被闭源甩开 01:24:32 To P 创业窗口接近关闭,下一波机会是 to C 01:27:32 “Adobe 系” AI 公司,谁在牌桌?三类玩家的位置 -节奏感,与必需的焦虑 01:31:35 Timing 在任何时候都重要,但 AI 时代更重要 01:35:34 创业以来经历的 3 次重要 timing 01:36:32 没有错过的原因是,“我很焦虑”,而焦虑是必要的 -挺过危机,韧性来自理性判断后的信念 01:42:52 危机中坚定继续,信念是来自认知 01:44:57 最困难时得到过收购意向,但一开始就没想接受 01:45:50 创业不是残酷,而是痛并快乐 01:47:59 遇强则强,面对 3 次挑战,成就感递增 01:49:44 最害怕自己迭代不够快 01:51:09 用理性的底层,控制感性的表达 01:53:36 第一次自由的、全情的、疯狂的,想做成一件事 -连点成线 01:57:51 Lovart 投资人夏令对垂类 Agent 的思考总结(晚点聊 110 期) 相关链接: 本期图文版:《Lovart 陈冕:Sora 证明巨头无边界,AI 创业得提前描绘未来》 (https://mp.weixin.qq.com/s/K9Str0wV85wvN85jCedzWA) 晚点聊 110:《与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专》 (https://www.xiaoyuzhoufm.com/episode/67fd8cafcc06f8ff48a73642?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 剪辑制作:甜食 本期主播: 小红书@曼祺_火柴Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token=YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw-EfCtqmFTkCIM2o=&xsec_source=app_share&xhsshare=CopyLink&appuid=5dfa9e92000000000100626f&apptime=1736682459&share_id=331aecb9ca7941f498d81fb9c32ea810)即刻@曼祺_火柴Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/%E6%92%AD%E5%AE%A2-%E7%BB%93%E5%B0%BE%E4%BD%9C%E8%80%85%E7%AD%BE%E5%90%8D.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
「反正我们就看,我能不能被闪电击中两次吧?」 *本次访谈的「图文版」和「视频版」今日将同步发布,视频首发于抖音。 本次访谈的图文版链接:《晚点专访张益唐:70 岁数学家,追逐第二次闪电》 (https://mp.weixin.qq.com/s/mGMYqJQlsg0_vgtr6huqtw) 图文版里对提及的数学概念、数学家和事件有更多详细注释,可阅读了解更多。 https://tc-new.z.wiki/autoupload/OASkVQNlBH2q2HBOsJa6JQ/20250928/DK9z/2930X1642/%E6%92%AD%E5%AE%A2%E6%8F%92%E5%9B%BE.png/webp 很长一段时间里,张益唐是作为一个励志传奇,而非数学家被人谈论与记忆的。 他身上有能触动所有人的戏剧性:一个北大数学系的天才,在美国博士毕业后因未获导师推荐求职不顺,多年来辗转于列克星敦、纽约的各种临时岗位,一度住在房车里。到 2013 年,他突然在 58 岁“高龄”,以一位大学讲师的身份攻克了百年数论难题“孪生素数猜想”,震惊世界。 今年 6 月底,张益唐举家回国,全职加入中山大学香港高等研究院。我们在他回国不久后前往广州专访了他。 作为一个数学家,张益唐对挫折、低谷、孤独、命运都有自己的解读。 他一直追求独特的想法,他最喜欢的状态,就是能一个人专注地思考数学问题。 你得能想到别人想不到的地方,这很难……但如果不追求独特的想法,很难做出新成果。 在那些世俗意义上困顿的日子里,他因不被人关注,反而保持着自己的视角。在张益唐密集思考孪生素数问题的那几年,数学界曾有过一个权威研讨会,结论悲观。不过张益唐两年后才知道有这个会。 大家觉得好像有一条路有可能做出来,最后谁也没走通,“就差了一根头发丝”。可是数学,你差一根头发丝也不行。 而我是从另外一个角度想的。如果你完全跟着别人弄,别人卡在那儿,你也得卡在那儿。 https://tc-new.z.wiki/autoupload/OASkVQNlBH2q2HBOsJa6JQ/20250929/7pAD/1600X1418/%E5%91%BD%E8%BF%90%E5%A5%BD%E5%9D%8F%EF%BC%8C%E5%BC%80%E5%A7%8B%E4%B8%8D%E7%9F%A5%E9%81%93.jpg/webp 张益唐长期的挫折与传奇的成功,都源于他面对数学的方式:十几年甚至数十年专注少数几个重大难题,几乎不发表阶段性成果;他像隐士一样独自思考,甚少与同行交流合作。 70 岁的张益唐,仍在攻克下一个大问题:“朗道-西格尔零点猜想”。 大量重要结论都以朗道-西格尔零点猜想的成立为条件,它也被认为可能与证明黎曼猜想有关联。所以张益唐的一位前同事会说,如果张益唐真能证出朗道-西格尔零点猜想,那就好比“被闪电击中两次”。 我们问张益唐,面对想解决的问题,他现在的数学直觉还有多强?“我觉得我还能做。”他说。在 70 岁,一个数学家在追逐他的第二次闪电。 https://tc-new.z.wiki/autoupload/OASkVQNlBH2q2HBOsJa6JQ/20250929/Sgrg/1318X1182/%E7%AC%AC%E4%BA%8C%E6%AC%A1%E9%97%AA%E7%94%B5.jpg/webp *本期是《晚点 LatePost》的前沿视频访谈系列 Next Quesiton 的第一期,视频首发于抖音。小宇宙的这个音频版会稍长一些,放了更多内容。 本期嘉宾:张益唐,数学家,中山大学香港高等研究院首席科学家 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: 只解大问题 03:10 “反正我们就看,我能不能被闪电击中两次吧?” 05:46 长时间想少数难题,不追求发论文的频率 09:07 “好运气还是坏运气,一开始你也讲不清楚” 13:31 兴趣起点:9 岁看《十万个为什么》哥德巴赫猜想、费马大定理 14:24 23 岁从锁厂工人成为北大数学系学生 16:04 专业是“计算数学”,但大三开始转向理论数学 数学的直觉 17:17 判断什么问题重要并不难,就看能不能做,敢不敢做 18:09 直觉是对正确的一种预感 20:42 几十年一直盘桓几个难题,是一种什么状态? 22:56 朗道-西格尔零点猜想:已经做出来了,正在寻找简化 25:30 独自面对数学,“交流是个困难的事” 光靠 AI 证不出黎曼猜想 26:46 现在 AI 的很多问题归根结底是数学问题 27:25 光靠 AI 解不出黎曼猜想,数学研究的周期和脑力强度远大于奥赛 28:44 49 年前的“四色问题”,一个错误的预言 31:24 想过黎曼猜想,但没看出一条路 数学家,最重要的专注 32:20 王虹的例子,判断一个人的才能不能看短期 33:28 做数学家,最重要的是专注,这也是一种天赋 35:07 辅导孙女数学,最主要是激发兴趣 “现在是回国最好的时候” 36:10 赴美 40 年后归国,目前中国对基础科学大力投入 37:15 最喜欢的数学环境:一个人不受干扰,写论文 37:40 新计划,资料都在脑子里 41:00 改写论文,“烦得要命” 43:21 普林斯顿高等研究院,给一流人才足够的空间 45:18 北大研究生导师潘承彪先生的“小考验” 47:12 不希望学生转行,但尊重选择 自得其乐,没有退休 48:12 如果给孪生素数问题写一本《费马大定理》? 50:17 “三大悲剧的作者会被人遗忘,但阿基米德不会。”没想过不朽,也不追求 52:02 “更快活”是一句虚拟的话 52:39 25 年没回过,“不想提了” 53:34 “我还可以” 55:03 “自得其乐,你自己在享受,觉得有意思,这就够了” -55:52 连点成线:往期节目呼应 相关链接: 《晚点专访张益唐:70岁数学家,追逐第二次闪电》 (待放) 「晚点聊」71 期:《“如果相信只靠 Scaling Laws 就能实现 AGI,你该改行了”,与香港大学马毅聊智能》 (https://www.xiaoyuzhoufm.com/episode/6668d95ebb0f9563f6302495?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 「晚点聊」108 期:《与马毅聊智能史:“DNA是最早的大模型”,智能的本质是减熵》 (https://www.xiaoyuzhoufm.com/episode/67d8a5084e49c8b5501f611b?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 剪辑制作:Nick 本期主播: 小红书@曼祺_火柴Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token=YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw-EfCtqmFTkCIM2o=&xsec_source=app_share&xhsshare=CopyLink&appuid=5dfa9e92000000000100626f&apptime=1736682459&share_id=331aecb9ca7941f498d81fb9c32ea810)即刻@曼祺_火柴Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/%E6%92%AD%E5%AE%A2-%E7%BB%93%E5%B0%BE%E4%BD%9C%E8%80%85%E7%AD%BE%E5%90%8D.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
「在 Meta 工作 7 年的创始人看到了什么?」 2025 年 6 月,Meta 以 143 亿美元收购 Scale AI 49%股权,招募了 28 岁的 Scale AI 创始人亚历山大·王(Alexander Wang);这之后,Meta 又天价招募顶尖 AI 研究员,开出最高 4 年 3 亿美元的惊人薪资。 这些新血液和 Meta 原本的部分 AI 团队在 6 月底正式组成了 Meta “超级智能实验室”(Meta Superintelligence Labs,MSL),由亚历山大·王任负责人。 就在一些人期待 Meta 要一雪 Llama 4 的失利时,9 月,Meta AI 团队离职潮爆发:既有已在 Meta 工作了 12 年、参与 PyTorch 构建的 Bert Maher(确定加入 Anthropic)等老员工离开;也有两位加入不足 2 个月的 OpenAI 研究员又重返 OpenAI(Avi Verma 和 Ethan Knight)。 本期节目,我们邀请了 Pokee AI 创始人朱哲清(Bill Zhu),他在 Meta 工作 7 年多,曾担任 Meta “应用强化学习”部门的负责人,去年 10 月开始创业,做以强化学习为内核的 Agent。 朱哲清分享了他观察到的/硅谷顶尖 AI 人才的流动趋势,以及 Meta、Google、OpenAI、Anthropic 等美国核心 AI 公司的组织特点,和由此延伸的业务策略。我们也讨论了,作为一个 AI 创始人,如何在今天打造原生于 AI(AI-Native) 的新组织。 *播客中提及的斯坦福课程是 CS231N,提及的授课者是 Percy Liang。 本期嘉宾:朱哲清,Pokee AI 创始人 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -Meta 人才动荡 03:00 Meta 曾是创业氛围最浓厚的硅谷大厂,但疫情时变臃肿 07:24 Meta、Google、亚马逊、OpenAI、Anthropic 组织特点盘点 14:15 “办公室政治”的实质是分功不均 17:21 一个组织能否保持目标一致:看 20% 的最关键工作能否被分完 19:24 OpenAI 的分裂,是使命的分裂 21:22 MSL(Meta Superintelligence Lab)现在缺能服众的负责人 26:24 顶尖 AI 人才有开辟新方向的野心,而大公司更想要主流路线上的进展 31:52 工程型人才决定未来 2 到 3 年发展,科学家型人才决定未来十年发展,但你可能活不过两三年 -硅谷吸引力 38:49 顶尖 AI 人才最想要什么?成为促使 AGI 到来的核心贡献者 40:34 人才吸引力:OpenAI、Anthropic 第一档,Google 1.5 档 42:03 OpenAI 和 Anthropic 如果倒了,硅谷一片 AI 投资机构都倒了 45:12 同为大公司,Google 做对了什么? 50:28 ChatGPT 在 ChatBot 的地位并非不受挑战 -AI-Native 的新组织 52:52 从 0 做来做 AI 组织的方法? 57:37 当工程师有了 10 倍产出 01:00:35 信任比以往更重要了 01:09:02 Meta 缺一个走一步、想三步的有经验经理人 01:10:56 推演明年 AI 人才争夺 01:14:17 斯坦福大课之 AI 教育一撇:“上完 CS231N,我能做出 sota 的 LLM 吗?” -01:18:11连点成线(往期节目呼应) 相关链接: 晚点聊 133:《4000日薪的实习生和零工化的程序员,与脉脉CEO林凡盘点25年AI人才市场》 (https://www.xiaoyuzhoufm.com/episode/68c9e8f2b2276b8b2b0dd393?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 晚点聊 116:《当AI研究者写科幻,与Meta田渊栋聊他的智能想象:我们终会“所思即所得”》 (https://www.xiaoyuzhoufm.com/episode/682896c716fbd45594de128c?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 《对谈 Pokee.ai 朱哲清:强化学习做核心,Agent 的少数派造法》 (https://mp.weixin.qq.com/s/ED8qQK1mitWCtzwHZRpTmQ) 《晚点独家丨Agent 初创公司 Pokee.ai 种子轮融资 1200 万美元,Point 72 创投,英特尔陈立武等投资》 (https://mp.weixin.qq.com/s/jaLMZ_8aPQpSgbmka15wjw) 晚点聊 111:《Agent#3|Pokee.ai 朱哲清的 Agent 造法:强化学习作后端,语言模型作前端》 (https://www.xiaoyuzhoufm.com/episode/680818eb79d324fdd40c2b5e?s=eyJ1IjogIjYwZDg0ZWU1ZTBmNWU3MjNiYjc3YjhmMCJ9) 剪辑制作:甜食 本期主播: 小红书@曼祺_火柴Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token=YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw-EfCtqmFTkCIM2o=&xsec_source=app_share&xhsshare=CopyLink&appuid=5dfa9e92000000000100626f&apptime=1736682459&share_id=331aecb9ca7941f498d81fb9c32ea810)即刻@曼祺_火柴Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/%E6%92%AD%E5%AE%A2-%E7%BB%93%E5%B0%BE%E4%BD%9C%E8%80%85%E7%AD%BE%E5%90%8D.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
「大厂集体从从“省省省”到“花花花”。」 *本期节目,也发布在了脉脉新上线的官方播客「职」无不言 (https://www.xiaoyuzhoufm.com/podcast/68c272ba6711863bc35b2a52)。 本周二(9 月 16 日),中国职场社交平台和招聘平台脉脉发布了《2025年AI人才流动报告》,分析了字节、阿里、腾讯、百度、小红书等很多公司的 AI 人才招募情况、待遇变化和流动情况。 https://tc-new.z.wiki/autoupload/OASkVQNlBH2q2HBOsJa6JQ/20250916/f7a8/1658X1252/%E6%88%AA%E5%B1%8F2025-09-16_16.03.19.png/webp *扫描图中二维码,可阅读完整报告。 或点击链接:《2025年AI人才流动报告》 (https://maimai.cn/jobs/collect_user_infos?articleId=61&fr=hb) 这期节目,我们分享了这份报告里很多有意思的事实、数据和洞察: - 大厂招聘规模总体翻 10 倍; - 期权行权条件变得更优惠; - 活水到 AI 部门的门槛更低了; - 顶尖 AI 方向博士生的日薪已来到 4000 元人民币; - 最受欢迎的 AI 方向应届生毕业院校排名:第一是清华,第二是北邮。 …… 我们也讨论了未来的工作会怎么演变,AI 会给脉脉这样的职场社交平台和招聘平台,带来什么新机会?林凡看到,白领工作也有被外包和零工化的趋势,硅谷已出现了这样的公司。 AI 不仅在影响具体的工作,也在重塑整个工作的概念本身。 本期嘉宾:林凡,脉脉创始人兼CEO 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: - AI 人才市场观察 02:55 Meta 3 亿美元买高级人才,不亏 08:41 相比去年,硅谷核心研究员的 AGI 信念更强了 19:47 中国大厂不在琢磨省钱,从降本增效到增本增效 27:03 字节 AI 岗位招募数量断崖领先,第二名是小红书(与阿里按淘宝、云等板块分开统计有关) 29:42 职言社区里的员工变化:阿里士气反弹,美团员工焦虑股价 37:58 最受欢迎 AI 应届生:清华第一、北邮第二 41:49 顶尖博士生实习生可拿到 4000 元日薪 44:38 初阶工程师招聘数减少,减少更快的还有各类管理岗 - 工作的未来 & 白领零工化 52:09 清华计算机毕业的林凡,博士退学钱经历的千禧 AI 研究 58:01 AI 浪潮给脉脉的机会:第一步是优化招聘各环节 01:03:35 出生即退休的终局之前,我们可能会先经历“人力上云” 01:08:18 当白领和知识工作也借由外包云平台来匹配,收入和职业成就感会怎么变? 01:13:03 脉脉会先做招聘的优化,有可能把招聘本身变成人机混合的企业服务 - AI 之后的教育与职场建议 01:19:57 花钱订阅用最好的 AI 产品,一天至少用十次 01:22:15 提高难以被 AI 化的复杂能力,本质是找到那些难被数据化的能力 01:25:45 工作时间会大大减少,我们都需要寻找真正的兴趣 相关链接: 《2025 年 AI 人才流动报告》(脉脉) (https://maimai.cn/jobs/collect_user_infos?articleId=61&fr=hb) 《脉脉林凡:企业与员工没那么对立了,但不是因为谁做了什么》 (https://mp.weixin.qq.com/s/xMr2KntbMLWh74km-3aEXw) 《脉脉 CEO 林凡:​当所有公司都有平等对话的内网,职言就可以关掉了》 (https://mp.weixin.qq.com/s/rHP5cf1Ga1ioUSKSuAfW3A) 剪辑制作:Nick 本期主播: 小红书@曼祺_火柴Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token=YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw-EfCtqmFTkCIM2o=&xsec_source=app_share&xhsshare=CopyLink&appuid=5dfa9e92000000000100626f&apptime=1736682459&share_id=331aecb9ca7941f498d81fb9c32ea810)即刻@曼祺_火柴Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/%E6%92%AD%E5%AE%A2-%E7%BB%93%E5%B0%BE%E4%BD%9C%E8%80%85%E7%AD%BE%E5%90%8D.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
「看不见的工具,托起每一颗芯片」 本期我们把焦点对准芯片产业链最上游的 EDA(电子设计自动化)。AI 浪潮下,GPU / 算力芯片火爆,但真正决定“芯片能不能做、做得好不好、做得快不快”的,甚至“卡脖子”的,其实是一套看不见的软件工具 —— EDA。 这个市场非常集中,基本被三巨头所垄断。 上个月,三巨头里最大的新思完成了对安似科技 350 亿美元的收购,这也是整个行业有史以来最大规模的并购,也帮新思补齐了“系统级仿真”的能力。再加上一些非市场的因素, EDA 也受到了前所未有的关注。 这期节目我们将和来自国际大厂与国产公司的两位资深工程师,拆解 EDA 的重要性、商业模式与壁垒,讨论 AI 如何重构 EDA 流程与工具栈,以及国产 EDA 的现实切口与长期路线。 本期节目由 Synopsys 新思科技支持播出。 本期嘉宾: 温戈|国际芯片设计大厂工程师,《了不起的芯片》作者 歪睿老哥|资深芯片架构师,《芯术:算力驱动架构变革》作者 本期主播: 邱豪,《晚点 LatePost》作者 程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -什么是 EDA,在半导体里的作用 02:14 摩天大楼的设计图,手机工程师每天用 EDA 比用手机还多 06:34 拆旧芯片设计流程:架构—验证—后端,分别在做什么 19:10 半导体行业的十倍定律:越早发现,越省成本 - EDA 的生意经 22:07 旱涝保收,但能赚铲子钱,赚不到金子钱 25:25 EDA 怎么收费 27:55 国产初创公司获客悖论 - AI 改变 EDA 29:23 用 AI 生成设计代码 33:04 AI 加速芯片设计,帮工程师想新 idea - 巨头成名史 39:21 长期收购补齐版图 42:10 为什么很难“完全垄断” - 国产 EDA 的机会 48:10 EDA 都是跟随产业机会发展起来 49:43 主流数字 SoC 渗透难;在模拟/版图提取等单点形成口碑更现实 *- 大模型带来了什么 * 52:33 芯片复杂度通胀 55:44 AI 会替代芯片工程师吗? 57:48 生成 Verilog 成为 AI 创业方向之一 *- 总结展望 * 01:12:59 三个词概括今年的芯片产业 01:19:17 未来十年行业地图的重心 01:24:22 对行业新人的建议 相关链接: 晚点聊 32 期:最怕客户来参观的行业:和谈三圈仔细谈谈芯片 (https://www.xiaoyuzhoufm.com/episode/6413a0a3a988be4df94059ab) 晚点聊 36 期:OPPO 突然中止造芯,生不逢时的雄心 (https://www.xiaoyuzhoufm.com/episode/646e9d893d6d8a0a296701fb) 晚点聊 32 期:最怕客户来参观的行业:和谈三圈仔细谈谈芯片 (https://www.xiaoyuzhoufm.com/episode/6539a26bf22dab1924a45eb1) 名词解释: EDA:Electronic Design Automation,电子设计自动化软件,用于芯片从电路设计到版图实现的全流程工具。 Verilog:一种硬件描述语言(HDL),广泛用于数字电路的建模与仿真。 IP:Intellectual Property,在芯片设计中指可复用的功能模块或电路设计单元。 Aart 博士:新思科技(Synopsys)长期 CEO Aart de Geus,被誉为“EDA 教父”,推动逻辑综合等关键技术发展。 逻辑综合:将高层次的硬件描述语言代码(如 Verilog)自动转换为可映射到芯片电路的门级网表的过程。 新思、Cadence、西门子被称为 EDA 三巨头:垄断芯片设计软件核心市场,这一说法大约形成于 2017 年西门子收购 Graphic Mentor,整合 EDA 业务之后。 安似科技(ANSYS):一家总部位于美国的工程模拟软件公司,前不久被新思收购。 剪辑制作:甜食 ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
「两位微软业务 leader 的 AI 使用方法。」 大公司怎么在这轮 AI 热潮中变化和发展,关系大量经济价值和就业人群。 微软是一个典型案例:它既是 OpenAI 的大投资方和云计算服务提的供者者,是这轮热潮的推动者之一;同时,这家超过 20 万人的巨头,自己也需要让整个组织更好地与 AI 协作,抓住 AI 带来的增长机会。 微软 2025 财年第二季度财报里提到:AI 业务已实现超过 130 亿美元年化收入,同比增长 175%。(AI 业务值: Copilot、Azure AI 服务、与 OpenAI 合作带来的订阅与云收入) 这期,我们就邀请了两位微软的管理层:段微之和黄秀兰,来和我们分享,作为微软内部的业务 leader,她们怎么和团队一起,用 AI 提效和增长。两位所处的领域,分别是销售与客户服务,以及广告业务,这刚好是重要的 AI to B 场景。 两位也都是有 20 多年经验的职业女性。段微之先后任职于甲骨文、EMC、亚马逊云科技(AWS)等全球科技公司;黄秀兰先后任职于 Stripe、戴尔、Google,加入微软前曾担任大宇无限 CEO。在本期后半段,她们也分享了一些职场发展经验。 本期节目录制于 GPT-5 发布前夕,段微之在节目中提到了孩子在用“苏格拉底对话式”教育 App,而就在一周多后,“苏格拉底”模式就成了 ChatGPT 的一个功能。 颠覆、炸裂似乎正在变少,但 AI 也正在每天、每周,都变得好用一点点。在微软,这已经变成了一些可统计的业务增长指标。 本期嘉宾: 段微之,微软大中华区副总裁,商用企业及新兴市场事业部总经理 黄秀兰,微软广告业务中国区副总裁 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -在微软,AI怎么驱动业务增长? 02:45 微软内部全面使用 Copliot 365 06:43 GPT-4o 后,Copilot 能力进一步提升 08:16 使用 AI 的震惊时刻:Copliot 的视频会议即时翻译 12:18 AI 怎么提升微软广告收入:从素材生成→智能投放→数据复盘的全链路 16:42 AI 销售提效,一组数字体现 21:48 企业客户用 AI 的成败总结:前提是数据 24:34 微软做任何事,不会不考虑商业闭环 32:34 关注的 AI 趋势:GPT-5、Agent 34:52 靠编程 Agent,作为文科生也能开发、上线一款游戏小 App -非技术部门怎么学AI技能,给 15 年前自己的职场建议 36:42 大量内部课程可选,非技术人员也能用 AI DIY 业务工具 41:30 扭转工作习惯没那么容易,对 AI 渗透有 KPI 考核 46:46 AI 进入生活:旅游攻略、多语言学习、苏格拉底式教育 51:27 工作与生活的平衡?为何对两位都不是问题 58:25 给 15 年前的自己的建议:更简单化的生活,销售的关键不是 social 01:03:43 “我要坐第一排,要第一个发言”,要有自己的 voice ** -「连点成线」** 01:15:18 Coding 作为创作 & 服务企业客户时,数据治理的重要性 特别企划: 《晚点 LatePost》和 AI 产品点评网站「观猹」联合发起了一份 lite 调研问卷,只有 10+ 个选择题,填写仅需3-5分钟!我们想了解:AI 应用产品在“模型调用”方面的真实现状——到底在不同场景中,哪些模型最多人用?最受欢迎? 调研数据脱敏后会成文公开,分享给大家,所有原始数据将被严格保密。问题也不涉及产品名称等敏感信息。 欢迎听友中的各位 AI 产品开发者和创造者来填写!十分感谢!!😄填写链接: https://www.wjx.cn/vm/eGkVD4a.aspx# 相关链接: 《独家专访飞书 CEO 谢欣:Office 是一个伟大的产品,而我们想做新时代的 Office》 (https://mp.weixin.qq.com/s/DBPAetRcW3vQv-NJpGa-Rw) 《晚点对话明超平:他们不信 AI coding 会是新的创作方式,我很开心》 (https://mp.weixin.qq.com/s/CTzqphisNyyj11DVglZO3A) 《晚点聊》106: 与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need (https://www.xiaoyuzhoufm.com/episode/67cdb53f7ccfd410926b0c66) 《晚点聊》110: 与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专 (https://www.xiaoyuzhoufm.com/episode/685a584ccaf6efb83f2c0042) 《晚点聊》127: 与真格戴雨森 25 AI 中场复盘:OpenAI的IMO金牌、Kimi K2翻盘、Agent普及和抢人大战 (https://www.xiaoyuzhoufm.com/episode/687e6bd796cb2d710960fd68) 剪辑制作:甜食 本期主播: 小红书@曼祺_火柴Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token=YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw-EfCtqmFTkCIM2o=&xsec_source=app_share&xhsshare=CopyLink&appuid=5dfa9e92000000000100626f&apptime=1736682459&share_id=331aecb9ca7941f498d81fb9c32ea810)即刻@曼祺_火柴Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/%E6%92%AD%E5%AE%A2-%E7%BB%93%E5%B0%BE%E4%BD%9C%E8%80%85%E7%AD%BE%E5%90%8D.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
「智谱 AutoGLM 2.0 上线,字节酝酿“豆包手机”,苹果和华米OV 也不会缺席。」 本周三,智谱发布了首个手机通用 Agent,AutoGLM 2.0,能点外卖、买票、订餐;无邀请码直接用、免费。 https://tc-new.z.wiki/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20250820/TYiw/5712X3397/WechatIMG100_1.jpg/webp (这期的封面就是,AutoGLM 上周日给参加产品交流会的朋友点点的奶茶~) 从市场规模和人群广度看,网页端的 Agent 是湖,手机端的 AI Agent 才是海。因为在中国,每天用手机的人,几乎等于总人口;而每天用电脑的人则少得多,很多人的日常生活和工作里根本不需要电脑。 https://tc-new.z.wiki/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20250820/5W8A/1080X472/accesswximg.png/webp 图注:AutoGLM 2.0,电脑端、移动端都可用 现在,大模型公司、移动互联网巨头和手机公司,都想到这片海里寻宝,手机端 Agent 将来一定会是一个兵家必争之地。 现在我们已经看到了一些苗头:《晚点》昨天就发布了一篇独家报道,讲字节的豆包手机进展;据此前市场信息,美团的王莆中亲自带队做生活服务助手 beam;苹果、华米OV也一定不会缺席手机 Agent。 这期,我们邀请 AutoGLM 2.0 的算法、工程和产品负责人,刘潇。从 AutoGLM 切入,我们一起聊了移动端 Agent 目前的产品形态;大模型公司、超级 App 厂商和手机硬件厂商,在移动端 AI 上的三方竞合关系;也通过回顾 AutoGLM 的开发过程,梳理了这类产品的难点、研发思路和未来的迭代方向。 1999 年出生的刘潇,今年 26 岁,本科毕业于清华大学计算机系。 制作这期时,我算了一下,这是我们第四期专门聊 Agent 了,之后也会有更多相关内容。所以我给这 4 期都加了 Agent 后缀和编号,方便大家检索往期。 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 本期嘉宾:刘潇,智谱 AutoGLM 算法、工程、产品负责人 时间线跳转: -AutoGLM 2.0 速览 01:57 能点奶茶、能发帖,不占用屏幕、无邀请码直接上线、免费 05:作为用户的疑问:隐私、安全如何保障?关键步骤需接管,真能省事? 09:06 定时任务,高频但尚待解锁的场景 12:05 AI 竞争与外卖大战交汇:点外卖、找美食可能会被用得最多 -终端 AI 三方竞合:大模型、超级 App、手机厂商 14:14 当 AutoGLM 来到美团与用户之间,美团们怎么想? 16:12 Agent 调 App 的方式:GUI(图形界面) 和 API 会长期并存 20:59 手机个人通用 Agent 和超级 App 内部 Agent(如美团 beam项目) 的关系? 25:52 移动端尚没有 Web 端的 MCP 生态 28:44 手机厂商也在做 Agent,智谱与荣耀、三星的合作进展 32:53 华为、小米这样的公司有多种终端,它们推跨端 Agent 的优势? 33:55 智谱作为大模型公司自己做硬件?暂时没考虑 -近 30 个月的 AI Agent 探索 37:17 23 年 3 月 GPT-4 发布,刘潇的重心从预训练转向 Agent 42:39 23 年 4 月到 8 月,做出全球首个评估 Agent 能力的基准 Agent Bench 47:25 训练冷启动,人来构造数据 53:44 强化学习(RL)初现威力,离线强化学习已能大幅提升效果 01:01:22 o1、R1 的启发:做 RL 时,要用结果来 supervise 模型,而非用过程 01:04:02 RL 的两个关键:环境和激励 01:11:12 24 年 10月至今:工程上实现不占用电脑,以更大规模的在线强化学习提升纠错能力 01:15:16 激烈竞争的前提是,移动端 Agent 真的好用、成熟了 01:18:11 需要提升:模型能力、Infra、成本优化 01:28:56 产品马上发布:忐忑、期待和迭代计划 -连点成线 01:32:14 110 期,Agent 入口大战的预言回顾 01:34:54 我们聊过的那些强化学习 特别企划: 《晚点 LatePost》 (https://www.latepost.com/)和 AI 产品点评网站「观猹」 (https://watcha.cn/)联合发起了一份 lite 调研问卷,只有 10+ 个选择题,填写仅需3-5分钟!我们想了解:AI 应用产品在“模型调用”方面的真实现状——到底在不同场景中,哪些模型最多人用?最受欢迎? 调研数据脱敏后会成文公开,分享给大家,所有原始数据将被严格保密。问题也不涉及产品名称等敏感信息。 欢迎听友中的各位 AI 产品开发者和创造者来填写!十分感谢!!😄填写链接: https://www.wjx.cn/vm/eGkVD4a.aspx# 相关链接: 《晚点独家丨“豆包手机” 酝酿中,字节为大模型寻硬件载体》 (https://mp.weixin.qq.com/s/ueN6K-6yYdO8J7rNUywF0w) 《晚点聊》110: 与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专 (https://www.xiaoyuzhoufm.com/episode/685a584ccaf6efb83f2c0042) 《晚点聊》96: 和楼天城聊 Robotaxi:学习人类优秀司机,让我绝望 (https://www.xiaoyuzhoufm.com/episode/676c92ed4e2405e3fde38272) 晚点聊 106 期:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need (https://www.xiaoyuzhoufm.com/episode/67cdb53f7ccfd410926b0c66) 《晚点聊》111: Pokee.ai 朱哲清的 Agent 造法:强化学习作后端,语言模型作前端 (https://www.xiaoyuzhoufm.com/episode/680818eb79d324fdd40c2b5e) 剪辑制作:Nick 本期主播: 小红书@曼祺_火柴Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token=YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw-EfCtqmFTkCIM2o=&xsec_source=app_share&xhsshare=CopyLink&appuid=5dfa9e92000000000100626f&apptime=1736682459&share_id=331aecb9ca7941f498d81fb9c32ea810)即刻@曼祺_火柴Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/%E6%92%AD%E5%AE%A2-%E7%BB%93%E5%B0%BE%E4%BD%9C%E8%80%85%E7%AD%BE%E5%90%8D.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
「AI 面试工具、700万美元天使轮、千人Party、996、AI增长黑客、“借”川普做广告。」 对今天的一批中国 AI 应用公司,出海和全球化几乎成为必选项。但怎么出海,又有不同的做法:有人立足中国,服务海外,这是产品“出海”;有人起家在国内,做到一定阶段后,整体搬迁,这是“肉身出海”。 然而,还有第三条路,就是直接“一步到位”,在硅谷创业。 这期节目,我就邀请了AI 面试工具 Final Round AI 的创始人 Michael Guan,来和大家分享非 ABC 的华人 founder,如何在美国湾区从 0 起步。 今年 27 岁的 Michael ,本科毕业于 UIUC,后来直接去耶鲁读了 MBA,2021 年肄业创业,后被收购;23 年 10 月开始了这一次创业。 这之后,FinalRound 团队加入了湾区知名孵化器 HF0,融到了近 700 万美元的天使轮。他们在旧金山开千人音乐 Party,也睡在公司 996;他们自己开发了一套 AI 系统,试图把增长和投放效率推到极致,也会借特朗普做线下广告。目前,Michael 说,FinalRound 的 AI 面试助手全系产品已达到了 1000 万美元的 ARR,即年度订阅收入;公司也已在美国之外的上海和班加罗尔都建立了办公室。 https://tc-new.z.wiki/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20250814/iN6y/1707X1280/WechatIMG178.jpg 图注:Final Round AI 组织的一次 Party 上,Michael(左)和联创 Jay(右) 这个年轻团队直接在全球市场出发的故事,也许会对有同样考虑的创业者有所启发。 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 本期嘉宾:Michael Guan,Final Round AI 创始人&CEO 时间线跳转: -在旧金山,融到 700 万美元天使轮 03:45 受“贾维斯”启发做主动式 AI,99美元/个月,第一个用户紧急打钱 10:33 ARR计算套路,有人用最高单日✖️365 14:11 入选HF0孵化器,3个月收入翻3倍,那些反直觉的选择 23:29 第一笔正式融资,688 万美元的天使轮 27:46 自己也投过28家创业公司,“一起遛狗,一起音乐,相互投资” -HF0后收入再翻 3 倍:开音乐节也996、用Agent 驱动增长&“借”特朗普做广告 34:17 狂欢,也狂卷:每月一次小型音乐节,996 风靡硅谷 41:46 HF0至今收入再翻 3 倍:AI Agent 驱动的投放和增长 50:14 在拉斯维加斯做 KOL 拍摄屋,“借”特朗普做广告 58:04 B2B新产品:不是帮企业面试提效,是想把面试变成 “AI 试用期” 01:02:45 现在不是零和竞争的时候 01:09:05 最近的思考:未来的招聘不是考核结果,是考核过程 特别企划: 《晚点 LatePost》 (https://www.latepost.com/)和 AI 产品点评网站「观猹」 (https://watcha.cn/)联合发起了一份 lite 调研问卷,只有 10+ 个选择题,填写仅需3-5分钟!我们想了解:AI 应用产品在“模型调用”方面的真实现状——到底在不同场景中,哪些模型最多人用?最受欢迎? 调研数据脱敏后会成文公开,分享给大家,所有原始数据将被严格保密。问题也不涉及产品名称等敏感信息。 欢迎听友中的各位 AI 产品开发者和创造者来填写!十分感谢!!😄填写链接: https://www.wjx.cn/vm/eGkVD4a.aspx# 相关链接: 《晚点聊》121: PingCAP黄东旭的“内在世界源代码”:《黑镜》、程序之美和创作自由 (https://www.xiaoyuzhoufm.com/episode/685a584ccaf6efb83f2c0042) 关联:出海,“最好的全球化是本地化”。 《晚点聊》110: 与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专 (https://www.xiaoyuzhoufm.com/episode/685a584ccaf6efb83f2c0042) 关联:垂直 Agent 的机会,以服务结果为收费依据的新商业模式。 剪辑制作:Nick 本期主播: 小红书@曼祺_火柴Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token=YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw-EfCtqmFTkCIM2o=&xsec_source=app_share&xhsshare=CopyLink&appuid=5dfa9e92000000000100626f&apptime=1736682459&share_id=331aecb9ca7941f498d81fb9c32ea810)即刻@曼祺_火柴Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/%E6%92%AD%E5%AE%A2-%E7%BB%93%E5%B0%BE%E4%BD%9C%E8%80%85%E7%AD%BE%E5%90%8D.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
loading
Comments