吴恩达关注蚂蚁开源模型Ling-1T等
Description
嗨,大家早上好,今天是2025年10月31号星期五,这里是《西瓜的呱》,我是来自西瓜实验室的呱呱。我们一起来看看,今天科技圈都有哪些新鲜事。
首先要说的,是最近在全球AI圈引起热议的一位老朋友——吴恩达。 在他最新一期的《The Batch Newsletter》中,吴恩达重点关注了蚂蚁集团开源的万亿参数语言模型——Ling-1T。 这款模型最有意思的地方在于:虽然它被定义为“非推理模型”,但在多项任务上表现出的推理能力,已经接近甚至超过了闭源的顶尖推理模型。 蚂蚁团队在一份58页的技术报告中,详细披露了他们在架构设计、训练策略到工程优化的一系列创新。 比如他们提出的“Every Activation Boosted”理念,意思是要让模型的每一次激活都能更聪明;还有FP8精度下的万亿参数训练,既节省算力又保持性能。 一句话总结:这不是简单的参数堆叠,而是一次让“开源模型也能超神”的系统性突破。
而说到智能系统的落地,另一条大新闻来自出行领域。 优步(Uber)宣布,计划从2027年开始在全球范围内部署自动驾驶车队。 他们这次是和英伟达合作,采用最新的 Drive AGX Hyperion 10 平台,这是一整套自动驾驶软硬件解决方案,能实现L4级别的无人驾驶。 优步表示,未来的自动驾驶车队不仅能降低运营成本,还会和电动化战略结合,让整个出行网络更高效、更环保。 看起来,这场“自动驾驶+AI芯片”的组合拳,正让未来的城市交通加速驶入无人驾驶时代。
与此同时,IBM 也在AI赛道上打出了一张“轻量化”新牌。 他们推出了四款 Granite 4.0 Nano 小模型,参数规模最小只有3.5亿,最大也不过15亿,但性能却一点不弱。 这些模型能直接在笔记本CPU上跑,甚至能在浏览器里本地推理,非常适合边缘设备和隐私场景。 IBM强调的方向很明确——不是比谁模型大,而是比谁跑得更快、更安全、更节能。 “战略高效”,可能会成为下一阶段AI竞争的新关键词。
再来看一条偏学术界的消息。 由 Sony AI、OpenAI 和斯坦福大学 联合撰写的权威专著《The Principles of Diffusion Models》正式发布。 这本书长达460多页,系统梳理了扩散模型的理论基础与未来方向。 作者之一、原OpenAI研究员宋飏,现在已经加入Meta领导超级智能实验室。 书里把扩散模型和最优传输理论、薛定谔桥这些高深的数学联系起来,还介绍了如何让生成模型变得更快、更可控。 简单说,这是扩散模型领域的一本“圣经级”读物,想搞懂AI生成的底层逻辑,这本书很可能是必读。
最后,让我们关注一家国内视觉AI公司——格灵深瞳。 他们的灵感团队刚刚发布了最新视觉模型基座RICE(MVT v1.5)。 RICE 的核心理念是“通过差异化视觉表征来理解语义”,它能把图像分解成多个区域进行理解,还能识别图中的文字信息,一起构建更完整的语义表达。 团队用SAM模型处理了4亿张图像,提取出20亿个视觉区域,聚类出上百万个语义类别。 在多模态任务中,比如图像分割、视频追踪、视觉问答等,RICE的表现都非常亮眼。 未来版本还会进一步迈向视频编码,让视觉模型更接近真正的通用智能。
好了,以上就是今天的科技新鲜事。 从蚂蚁的Ling模型,到优步的自动驾驶,再到IBM的小模型和格灵深瞳的视觉突破,我们可以看到——AI正在从“规模竞赛”转向“效率与智能并行”。 这里是《西瓜的呱》,我是呱呱,我们明天见!








