AIContext | AI每日新闻

AIContext电台！每日播报AI最新资讯，让你持续保持AI上下文！

PLAY ON CASTBOX

2024.11.15 | AI 新闻速递

🤖 具身智能新标杆：EAI基准横空出世，o1-preview领跑榜单李飞飞与吴佳俊团队推出的Embodied Agent Interface（EAI）具身智能决策能力评价基准，不仅统一了目标表示方法，还通过线性时态逻辑（LTL）显著提高了模块间的互操作性，为未来研究提供了强有力的工具。🧠 大模型新突破：RouterDC高效组合，无需梯度回传南方科技大学与香港科技大学联合研究团队提出的RouterDC新方法，基于双重对比学习，高效组合多个大模型，显著优于现有路由方法，为大模型的实际应用开辟了新可能。🚶 Keras之父François Chollet离职：谷歌深度学习框架迎来新篇章谷歌宣布Keras之父François Chollet正式离职，尽管未来动向未明，但其对Keras、JAX、TensorFlow和PyTorch的支持将继续，业界猜测他可能被Anthropic挖角，引发广泛关注。🚗 红旗汽车智能化转型：5nm芯片与纯视觉智驾系统领航未来红旗汽车发布自主研发的5nm车载芯片“红旗1号”和纯视觉端到端智驾系统“司南智驾”，展示了中国汽车工业在智能化和电动化方面的重大进步。🔒 火山方舟数据安全升级：全周期防护，用户隐私无忧火山方舟大模型平台通过全周期的安全方案，强化了用户数据的安全性和隐私性，确保数据在传输、存储和处理过程中始终处于高度保密状态。🤖 灵宝CASBOT发布首款全尺寸双足人形机器人：52自由度，续航超4小时灵宝CASBOT推出的“CASBOT 01”，具备52个自由度，算力达550T，续航时间超过4小时，能够进行多种家务活动，标志着人形机器人领域的新突破

11-14

04:41

2024.11.13 | AI 新闻速递

🧬 AlphaFold3开源：AI助力蛋白质结构预测新时代DeepMind的AlphaFold3开源发布，为结构生物学带来革命性工具，推动药物发现和分子生物学研究。🎵 音乐AI新星：博士研究者加入字节跳动Seed团队一位音乐生成领域的博士研究者选择加入字节跳动，看好其在音乐生成领域的资源和团队实力。🧠 测试时训练：MIT研究揭示语言模型推理能力提升之道MIT研究发现，测试时训练（TTT）显著提升语言模型抽象推理能力，挑战复杂任务必须依赖符号组件的假设。🔬 CryoSTAR：AI与冷冻电镜结合，解析蛋白质动态构象字节跳动研究团队提出CryoSTAR方法，成功应用于蛋白质动态构象解析，为生命科学和制药领域带来新工具。📈 数学新突破：哈佛和拉霍亚团队发现复杂椭圆曲线哈佛大学和拉霍亚团队发现复杂椭圆曲线，扩展了椭圆曲线研究的前沿，为解决椭圆曲线秩问题提供新线索。💻 OpenCoder：开源代码大模型，推动AI可复现发展OpenCoder团队发布完全开源的代码大模型，提供全方面构建细节，推动代码AI的可复现发展。🔒 隐私保护新方法：苏黎世联邦理工团队提出严格评估策略苏黎世联邦理工团队提出新方法，严格评估机器学习算法的隐私保护能力，解决现有评估方法的误区。🎓 NeurIPS 2024线下论文分享会：AI研究者的学术盛宴机器之心联合黄大年茶思屋和智源社区举办NeurIPS 2024线下论文分享会，提供学术交流平台。🖼️ 百度iRAG：检索增强文生图技术，消除AI幻觉百度发布iRAG技术，解决大模型图片生成幻觉问题，推动AI应用的可用性和可信度提升。🎨 机器人艺术家Ai-Da：百万美元画作引发AI与艺术讨论机器人艺术家Ai-Da创作的图灵肖像在苏富比拍卖会上高价成交，引发关于人工智能与艺术创作的讨论。🚀 AlphaFold3开源：谷歌诺奖级AI模型推动生命科学研究谷歌开源AlphaFold3，推动药物发现和疾病治疗，加速生命科学领域的研究进展。🚗 文远知行股价暴涨：自动驾驶技术市场前景广阔文远知行股价暴涨40%，市值达到61.68亿美元，反映市场对自动驾驶技术的高度热情。🗣️ Claude团队深度访谈：AI发展与未来趋势展望Claude团队核心成员讨论AI模型的开发、公司扩展策略及行业未来趋势，强调“人才密度”的重要性。🔍 SearchGPT开源：港中文MMLab推出Vision Search Assistant港中文MMLab、上海AI Lab、腾讯团队联合发布开源版SearchGPT，实现模型内部知识的实时更新。🧠 MIT研究：测试时训练大幅提升大模型推理能力MIT研究发现，测试时训练显著提升大模型推理能力，在ARC任务中表现优于GPT-4和Claude，超越人类平均水平。

11-12

09:32

2024.11.12 | AI新闻速递

🤖 天工开源计划启动：具身智能机器人赋能千行百业国家地方共建具身智能机器人创新中心推出天工开源计划，助力具身智能技术发展，打造机器人生态圈。🧬 GeoStab-suite：几何学习模型革新蛋白质突变预测清华大学团队开发的GeoStab-suite模型，通过几何学习显著提升蛋白质突变预测精度，研究成果发表于《Nature Computational Science》。🚗 自动驾驶新突破：极限操控条件下的安全漂移机器人顶会CoRL展示新技术，使自动驾驶汽车在极限操控条件下实现安全漂移，优于专家模型。🎨 SeedEdit：字节跳动推出国内首个通用图像编辑模型字节跳动发布SeedEdit模型，用户可通过自然语言指令轻松实现图像编辑，目前已上线豆包PC端和字节AIGC平台。🔍 LoRA微调与完全微调：MIT研究揭示差异MIT研究团队探讨LoRA与完全微调方法的差异，发现LoRA微调中的“侵入维度”影响模型泛化能力。📚 GitHub新增AI学习路径：助力工程师全面掌握AI技术GitHub开发者路线图资源库新增AI学习路径，提供从基础到高阶的详细资源链接和教程。🎭 AutoHallusion：自动检测大模型幻觉现象马里兰大学团队开发AutoHallusion框架，通过自动生成幻觉案例，有效缓解大模型幻觉研究中的数据集缺乏问题。🔮 OpenAI调整策略：应对下一代大模型数据匮乏挑战OpenAI预计2028年现有数据将被用尽，正研究新技术应对数据匮乏，引发AI行业发展方向讨论。🌐 SAC-KG：中科大团队提升领域知识图谱构建效率中科大MIRA实验室提出SAC-KG框架，利用大型语言模型自动化构建知识图谱，准确率和领域特异性显著提升。🧠 FrontierMath：评估大模型高级数学推理能力新基准陶哲轩等顶尖数学家提出FrontierMath基准，测试结果显示顶尖大模型解题率均未超过2%。🛰️ 猎户座模型发布：OpenAI揭示AI发展进入收益递减阶段OpenAI最新模型“猎户座”提升不及预期，标志着AI模型发展进入收益递减阶段，引发业界广泛讨论。🎨 ChatGPT新功能：根据用户生活绘制画作ChatGPT推出新功能，用户可输入一句话让AI绘制反映用户生活的画作，迅速走红并展现强大模拟能力。🔍 SearchLVLMs：多模态大模型实时信息反馈增强上海人工智能实验室等机构提出SearchLVLMs框架，增强多模态大模型实时信息反馈能力，提升回答准确率。

11-11

07:09

2024.11.08 | AI 新闻速递

🔬 量子级精度：微软AI系统革新蛋白质模拟微软研究院推出的AI2BMD系统以量子级精度高效模拟蛋白质的全原子运动，解决了传统分子动力学模拟的难题，为药物发现带来新希望。🏥 数字化智慧病理：罗氏诊断引领医疗革新罗氏诊断在进博会上展示的数字化智慧病理解决方案，通过AI辅助判读算法提升病理诊断效率和准确性，推动精准医疗发展。🤖 机器人革命：自变量推出全球最大具身大模型自变量机器人公司宣布推出全球最大规模的端到端统一具身大模型WALL-A，预示着机器人领域的“ChatGPT时刻”即将到来。🔗 超连接技术：豆包大模型突破梯度消失难题字节跳动豆包大模型团队提出的超连接技术，通过动态调整连接权重，显著提升模型性能，为密集模型和混合专家模型带来新突破。📊 表格数据处理新星：浙江大学推出TableGPT2浙江大学研发的TableGPT2在处理表格数据方面超越GPT-4，适用于商业智能等生产级应用，推动多模态模型技术进步。🌐 具身智能峰会：探讨机器人与世界模型未来智源论坛2024具身与世界模型专题峰会聚焦具身智能与世界模型最新进展，探讨数据平台标准化与开放性，推动机器人领域协同进化。🔒 多轮对话安全风险：上海交大揭示OpenAI o1漏洞上海交大与上海人工智能实验室研究团队揭示OpenAI o1在多轮对话中的安全风险，开发多轮攻击算法并开源安全对齐数据集，提升AI鲁棒性。

11-07

04:32

2024.11.07 | AI 新闻速递

🌩️ "八观"气象大模型：精准预测未来天气，助力新能源电力系统升级阿里巴巴达摩院发布的“八观”气象大模型，通过高精度预测，显著提升了新能源发电和电力负荷的准确率，为应对极端天气提供了强有力的技术支持。💡 AMD逆袭英特尔：数据中心处理器市场的新霸主 AMD在第三季度数据中心处理器市场首次超越英特尔，其EPYC处理器的竞争优势显著，推动了市场格局的变革。🤖 腾讯混元发布巨型MoE模型：超越Llama3.1，引领AI新纪元腾讯混元团队推出的Hunyuan-Large模型，在多项评测中表现卓越，已成为业界已开源的最大MoE模型，推动了AI技术的新突破。📚 大语言模型在算法设计中的应用：潜力与挑战并存通过对180多篇论文的回顾，研究人员探讨了LLMs在算法设计中的广泛应用及其面临的挑战，为这一新兴领域的发展提供了重要洞见。🌐 AgentOccam：零样本LLM智能体的革命性突破伊利诺伊大学香槟分校和亚马逊的研究团队开发的AgentOccam智能体，通过优化网络交互，显著提升了在WebArena上的性能，成为新的SOTA。🤖💰 Physical Intelligence获4亿美元融资：AI机器人技术的崛起 Physical Intelligence公司成功融资4亿美元，显示出市场对AI驱动机器人技术的高度兴趣，预示着机器人与人类协作的未来。🔬 FoldMark水印方法：AI蛋白生成模型的版权保护新策略普林斯顿大学王梦迪团队提出的FoldMark水印方法，有效解决了生成式人工智能在蛋白质生成模型中的版权保护问题，为生物安全提供了新的保障。🛡️ OpenAI推出RBR机制：提升语言模型安全性的新途径 OpenAI安全团队提出的基于规则的奖励机制，通过细粒度控制模型响应，显著提升了语言模型的安全性，为AI应用提供了更可靠的保障。

11-06

05:17

2024.11.06 | AI 新闻速递

🎙️ 国产AI播客崛起：挑战谷歌NotebookLM 国内开发者推出的多个AI播客平台在功能和创意上有所突破，但在自然度和内容深度上仍需追赶谷歌NotebookLM。🤖 OpenAI扩展硬件领域：前Meta高管加盟 OpenAI宣布Meta增强现实眼镜项目前负责人Caitlin Kalinowski将加入公司，领导机器人和消费类硬件业务，预示着OpenAI在硬件领域的进一步扩展。🧠 谷歌DeepMind新框架：提升LLM对齐能力谷歌DeepMind与芝加哥大学合作开发的eva框架，通过非对称自博弈机制提升大型语言模型的自我提升和泛化能力，无需依赖人工数据。📹 视频分割新突破：SAM2Long提升长视频处理能力港中文和上海AI Lab的研究团队推出的SAM2Long模型，通过多路径记忆树结构和不确定性处理机制，显著提升长视频分割精度，超越现有方法。🔌 华为与中科大合作：生成大规模神经电路框架中国科学技术大学王杰教授团队与华为诺亚方舟实验室合作，提出可生成大规模神经电路的框架，为新一代芯片电路逻辑综合工具奠定基础。🧬 多模态深度学习模型：预测组织特异性可变剪接位点浙江大学良渚实验室开发的SpTransformer模型，用于预测pre-mRNA序列中的组织特异性可变剪接位点，为疾病相关遗传变异提供新见解。🛡️ 文本到图像生成安全检测：Latent Guard框架牛津大学与香港科技大学联合提出的Latent Guard框架，通过在文本编码器的潜在空间中检测恶意输入，提升文生图模型的安全性。🔍 天工 AI搜索引擎升级：专业数据覆盖全球昆仑万维推出的融入大模型能力的AI搜索引擎「天工 AI」在金融投资和科研学术领域进行了重大升级，提供更专业、准确和高效的搜索体验。👕 AI换衣技术：解决线上购物“货不对板”问题一款AI换衣小项目引发关注，用户只需上传衣服图片，AI即可自动搭配并生成视频展示穿搭效果，减少退货率，但生成视频中仍存在不完美之处。

11-05

05:14

2024.11.05 | AI 新闻速递

🔥 块状注意力机制：AI推理效率的飞跃《Block-Attention for Efficient RAG》论文提出了一种新的块状注意力机制，大幅提升了检索增强生成模型的推理速度和准确率。🎨 AI幻觉优化图像分割：ProMaC框架的突破伦敦大学玛丽女王学院与上海交通大学的研究团队开发的ProMaC框架，利用AI幻觉优化图像分割技术，显著减少了手动提示的依赖。🧠 语言模型的自我反思：LLM的新能力探索多机构联合团队的研究发现，语言模型可以通过内省了解自身，这一能力有助于创造更诚实的模型，但也可能避开人类监督。💊 AI驱动药物设计：TamGen平台的革命性进展微软研究院、中国科学技术大学和全球健康药物研发中心合作开发的TamGen平台，通过Transformer自注意力机制实现分子精准生成与优化，显著加速了药物发现流程。

11-04

03:06

2024.11.02 | AI 新闻速递

🌐 字节跳动与香港大学合作：HybridFlow框架大幅提升强化学习效率字节跳动豆包大模型团队与香港大学共同开发的HybridFlow框架，通过混合编程模型和分布式计算技术，将强化学习训练吞吐量提升至20倍，解决了大模型训练中的灵活性和性能问题。💊 中国科学院与华西医院合作：PRnet模型助力药物发现中国科学院与四川大学华西医院开发的PRnet深度生成模型，成功预测转录对新型化学扰动的反应，推荐了233种疾病的候选药物，研究成果发表于《Nature Communications》。🏆 Richard Sutton团队提出“奖励聚中”新思想，强化学习性能大幅提升Richard Sutton教授团队提出的“奖励聚中”新思想，通过减去平均奖励显著提升了几乎所有强化学习算法的性能，该研究入选首届强化学习会议（RLC 2024）。🔍 OpenAI宣布ChatGPT成为AI搜索引擎，实时信息能力全面开放OpenAI宣布ChatGPT正式成为AI搜索引擎，消除了即时信息的最后短板，付费订阅者和候补名单用户可立即使用联网的实时对话信息能力。🧠 MIT研究发现LLM几何结构与大脑功能性脑叶相似MIT研究团队发现大型语言模型（LLM）在学习概念时形成的几何结构与大脑功能性脑叶的相似性，揭示了AI系统在处理信息时自然地发展出与生物大脑相似的几何和分形结构。🤖 中山大学与华为诺亚合作：PIVOT-R模型提升机器人复杂任务表现中山大学和华为诺亚等单位的研究团队提出的PIVOT-R模型，通过视觉-语言模型解析用户指令，指导机器人执行任务，成功率超过谷歌的RT-1模型26.6%。🚀 清华大学交叉信息院发现data scaling laws，机器人零样本泛化能力突破清华大学交叉信息院的研究团队在具身智能领域取得突破性进展，发现了data scaling laws，使得机器人能够在零样本情况下泛化到全新场景和物体，彻底改变通用机器人的开发方式。

11-01

03:59

2024.11.01 | AI 新闻速递

🌟 科大讯飞发布星火4.0 Turbo：七大能力超越GPT-4 Turbo科大讯飞在第七届世界声博会上推出星火4.0 Turbo，性能大幅提升，并启动国产超大规模智算平台“飞星二号”。🧬 DNASimCLR：基因序列分类准确率高达99%，AI技术革新基因研究山东大学研究人员开发的DNASimCLR框架，利用AI技术在基因序列分类中实现突破性进展，准确率高达99%。🧬 AI设计新型DNA开关：精准控制基因表达麻省理工学院、哈佛大学和耶鲁大学的研究人员利用AI设计出数千个新型DNA开关，实现对基因表达的精确控制。🔧 百川智能推出1+3产品矩阵：低成本实现最佳私有化部署百川智能发布全新产品矩阵，帮助企业以最低成本实现最佳私有化部署，支持混合数据调优，多场景可用率高达96%。🚗 吉利雷神EM-i超级电混：AI科技助力极致节能吉利汽车发布雷神EM-i超级电混系统，集高性能电混技术与AI科技于一体，提供极致节能和智能体验。🎨 Recraft V3模型登顶Hugging Face排行榜：文本转图像质量卓越AI初创公司Recraft的Recraft V3模型在Hugging Face文本转图像排行榜上超越知名公司，提供高质量图像生成。🤖 英伟达HOVER模型：1.5M参数控制人形机器人执行复杂动作英伟达GEAR团队发布HOVER模型，仅用1.5M参数即可控制人形机器人执行多种机体运动。🎭 MimicTalk算法：15分钟训练个性化3D数字人模型浙江大学与字节跳动合作开发的MimicTalk算法，大幅提升个性化数字人模型的训练效率和质量，仅需15分钟即可完成训练。🔮 Moirai-MoE：下一代时序预测基础模型引领AI预测新纪元Salesforce、新加坡国立大学和香港科技大学共同推出Moirai-MoE模型，在39个数据集上显示出优越的性能。🏭 波士顿动力Atlas机器人：工厂环境中的全自动操作展示波士顿动力公司发布视频，展示Atlas人形机器人在工厂环境中的全自动操作能力，无需预设程序或远程操控。📚 苹果研究：小型语言模型训练的计算瓶颈与成本效率苹果发布研究论文，探讨小型语言模型训练的计算瓶颈和成本效率，发现FlashAttention的重要性。

10-31

04:45

2024.10.31 | AI 新闻速递

🎓 学术荣耀：陈长汶教授荣获ACM SIGMM 2024杰出技术成就奖🤖 科技新星：Cyan青心意创发布自研通用人形机器人OrcaⅠ🧬 生物医药突破：DeltaDock框架大幅提升分子对接效率📐 数学天才：高中生发现勾股定理的10种新证明方法🛠️ 技术升级：GitHub Copilot新增多款AI模型选择🌐 行业转型：Runway CEO预测AI成为基础设施🎮 游戏AI革命：北大与UCLA团队开发新型智能体🗣️ 语音技术革新：港中大与趣丸科技推出MaskGCT模型🤖 人形机器人新篇章：中科慧灵发布“灵宝CASBOT”品牌

10-31

03:57

2024.10.30 | AI 新闻速递

🤖 AI机器人进军农业：宇树科技机器狗实地测试成功社交平台上涌现大量AI生成的机器人干农活视频，而宇树科技的B2机器狗已在泰山成功完成垃圾清运任务，展示了机器人技术在实际应用中的巨大潜力。🔬 TraCoCo：3D医学图像分割新突破澳大利亚阿德莱德大学和同济大学联合研发的TraCoCo半监督学习方法，通过创新损失函数提升了3D医学图像分割的准确性和鲁棒性，达到行业领先水平。🌐 AI巨头再添猛将：Julian Schrittwieser加盟Anthropic谷歌DeepMind资深研究员Julian Schrittwieser宣布加入AI公司Anthropic，这一变动被视为AI领域的重要事件，预示着Anthropic在强化学习领域的进一步扩张。📊 Grok大模型新增图像理解功能马斯克旗下xAI公司推出的Grok大模型最新更新增加了图像理解功能，不仅能将手写公式转换为LaTeX，还能解释梗图，展示了AI在图像处理方面的强大能力。💻 丹麦首台AI超级计算机Gefion启动由NVIDIA技术支持的丹麦首台AI超级计算机Gefion正式启动，旨在推动量子计算、清洁能源等领域的突破，标志着丹麦在AI研究和应用方面迈出了重要一步。🎨 OmniGen：统一图像生成任务的扩散模型智源推出的新扩散模型架构OmniGen，通过简化操作和知识迁移能力，支持多种图像生成任务，现已开源并在GitHub和Hugging Face上提供代码和演示。📜 OSI发布开源AI定义1.0版开放源代码促进会（OSI）发布了“开源AI定义”的1.0正式版，明确了开源AI系统的标准，Llama 3因未能满足要求而引发争议，Meta表示将继续推动AI发展。🤖 HIL-SERL：机器人强化学习新框架UC伯克利BAIR实验室提出的HIL-SERL强化学习框架，使机器人仅需短时间训练即可实现高成功率，展示了在复杂任务中的强大适应能力。🎯 D-FINE：目标检测精度新突破中国科学技术大学研究团队提出的D-FINE目标检测方法，通过创新技术显著提升了检测精度和效率，在COCO数据集上超越了现有方法，为实时目标检测带来新突破。

10-29

05:38

2024.10.29 | AI 新闻速递

🍽️ AI推荐系统被“玩坏”：伦敦居民操纵谷歌AI，餐厅评分飙升伦敦居民在Reddit上为一家餐厅狂刷好评，导致谷歌AI推荐系统失灵，该餐厅成为伦敦最佳牛排三明治推荐之一。💻 通义“代码模式”：非专业程序员也能轻松编程阿里旗下通义推出“代码模式”，通过实时预览功能让非专业程序员也能轻松生成代码，支持40多种编程语言，直接在网页上渲染成应用。📝 Meta开源NotebookLlama：挑战谷歌NotebookLMMeta推出基于Llama模型的开源项目NotebookLlama，处理PDF文件并生成播客脚本，已在GitHub上开源，未来计划改进语音模型和支持更多类型文件。🚗 DriveDreamer4D：世界模型助力自动驾驶4D重建极佳科技联合多家研究机构推出DriveDreamer4D，利用世界模型增强4D驾驶场景重建效果，获得超过80%的用户偏好投票。🧠 AI自我进化新突破：长期记忆驱动智能升级普林斯顿大学等研究机构发表论文，探讨长期记忆（LTM）对AI自我进化的重要性，提出基于多智能体的Omne框架，提升模型处理长期数据的能力。💰 轻舟智航获数亿元融资：加速自动驾驶技术研发轻舟智航完成数亿元人民币的C+轮融资，用于加大全栈自动驾驶技术研发投入，推进中高阶NOA方案的大规模量产交付。🎥 VERIFIED系统：细粒度视频理解新标杆清华大学研究团队在NeurIPS 2024上提出VERIFIED系统，解决细粒度视频片段检索中的多对多问题，推动细粒度视频理解的发展。

10-28

04:27

2024.10.28 | AI 新闻速递

🎓 斯坦福AI工具升级：Co-STORM引领学术研究新纪元斯坦福大学推出的Co-STORM AI工具，通过协作对话机制，助力学术研究取得突破性进展，已在GitHub获得12k Star。🤖 全球最酷人形机器人SE01：众擎机器人引领服务市场新潮流深圳众擎机器人公司发布SE01，具备32个自由度，计划2025年实现年产销超千台，开启人形机器人新时代。🔒 AI安全新突破：AdvUnlearn框架提升扩散模型鲁棒性密歇根州立大学OPTML实验室提出AdvUnlearn框架，有效增强扩散模型在对抗性提示攻击下的安全性，为生成式AI保驾护航。

10-27

02:24

2024.10.26 | AI 新闻速递

🗣️ 智谱清言推出情感语音通话功能，国产AI技术再创新高智谱清言宣布其情感语音通话功能全面上线，并开源了情感语音模型GLM-4-Voice，标志着国产AI技术在多模态交互和自主智能体方面的重大进步。🌐 华为与伦敦大学学院合作推出LiMAC架构，AI操作手机更智能华为与伦敦大学学院合作推出的LiMAC架构，使AI能够像人类一样操作手机，显著缩短执行时间至平均每个任务只需3秒，性能超越了基于GPT-4的基线。🤖 稚晖君开源智元机器人灵犀X1，推动国内机器人技术进步稚晖君在1024程序员节上宣布开源智元机器人灵犀X1的全套图纸和代码，提供了详细的硬件和软件资源，被视为国内机器人开源界的重要里程碑。🔬 ICML 2024新算法TDPO-R，提升扩散模型生成效率武汉大学等机构的研究人员在ICML 2024上提出TDPO-R算法，通过引入时间差分奖励机制，有效缓解了扩散模型对齐时的奖励过优化问题，有望推动生成模型的发展。🦾 波兰公司Clone Robotics发布仿生机器人Torso，灵感来自《西部世界》波兰机器人公司Clone Robotics发布的仿生机器人Torso，采用“人造肌肉”驱动，模仿人类肌肉骨骼结构，能够进行复杂动作，团队已筹集64万美元资金推进技术发展。📚 arXiv与Hugging Face合作，简化研究资源获取流程arXiv与Hugging Face合作推出新功能，用户点击按钮即可直接访问相关论文、模型和数据集，极大提升了研究的便捷性。🧪 康奈尔大学开发LLM-EO算法，提升化学空间探索效率深度原理与康奈尔大学的研究团队开发了LLM-EO算法，利用大型语言模型显著提高了化学空间探索的效率，该研究已发布在预印平台arXiv上。

10-25

04:00

2024.10.25 | AI 新闻速递

🚶‍♂️ OpenAI高层变动：Miles Brundage离职投身AI政策研究OpenAI资深研究者和管理者Miles Brundage宣布离职，计划创立或加入非营利机构，专注于AI政策研究和倡导。🔍 AI透明化新工具：Transluce发布Monitor界面AI研究实验室Transluce发布Monitor工具，帮助研究者直观观察和分析大模型的内部计算过程。🛠️ 英伟达Blackwell芯片修复完成：2025年初量产英伟达CEO黄仁勋确认Blackwell AI芯片设计缺陷已修复，预计2025年初开始发货。🔒 谷歌开源SynthID-Text：提高LLM生成文本识别度谷歌DeepMind开发的SynthID-Text技术已开源，能够为大型语言模型生成的文本添加水印。🏆 OPPO Hammer-7B模型评测夺冠：工具调用表现卓越OPPO研究院与上海交通大学合作开发的Hammer-7B模型在工具调用评测中表现突出，综合排名第一。🧠 多校联合推出DuoAttention框架：提升长上下文推理效率MIT韩松团队与多所高校联合推出DuoAttention框架，大幅提升长上下文推理效率。

10-24

03:03

2024.10.24 | AI 新闻速递

🖥️ Claude 3.5 Sonnet升级：AI与计算机交互新突破Anthropic推出Claude 3.5 Sonnet和Claude 3.5 Haiku模型升级，提升AI与计算机软件交互能力，开启新的应用可能性🧠 WISE方法：解决大模型知识记忆编辑中的幻觉问题浙江大学团队提出WISE方法，通过双重记忆机制精确控制和更新大语言模型知识，提升模型可靠性和泛化能力。🤖 OKAMI方法：机器人通过视频学习人类操作德克萨斯大学奥斯汀分校与NVIDIA Research团队开发OKAMI方法，使机器人能够通过观看视频学习并模仿人类操作任务。🐜 MODEL SWARMS算法：群体智能优化大型语言模型谷歌与华盛顿大学研究团队提出MODEL SWARMS算法，借鉴群体智能行为优化LLM，提升模型适应性和效率。🧪 Prompt-MolOpt工具：提升分子优化效率浙江大学、中南大学与碳硅智慧团队联合开发Prompt-MolOpt工具，利用Prompt嵌入技术显著提升分子优化效率。🎨 Ideogram Canvas：AI画板工具引领创意新潮流Ideogram推出AI画板工具Canvas，凭借魔法填充和无限扩图功能，迅速获得用户好评。🌊 OceanBase 4.3.3GA版本：AI与数据库深度融合OceanBase发布4.3.3GA版本，深度融合AI与数据库处理能力，支持多模态数据融合查询，提升AI应用构建效率。🎥 Genmo Mochi 1：开源视频生成模型引领新纪元AI视频生成公司Genmo发布目前最大的开源视频生成模型Mochi 1，专为高保真运动和提示遵循能力设计。

10-23

04:09

2024.10.23 | AI 新闻速递

🌟 星绽OS开源：中国科技巨头联手打造安全系统软件新纪元中关村实验室、蚂蚁集团、北京大学等机构联合发布开源系统软件栈“星绽”，面向全球开发者开放，提升系统软件安全性。🔬 Meta发布OMat24：AI加速材料科学革命Meta公司推出“Open Materials 2024”数据集和预训练模型，通过AI技术推动材料科学发展，成为该领域最大公开数据集之一。🤖 AI价值观对齐：超越人类偏好的新思路麻省理工学院等研究团队探讨AI与人类价值观对齐难题，提出超越偏好聚合，直接对齐“优秀助手”等规范性目标。🔍 合合信息图像篡改检测：守护数字内容安全合合信息在智能图像处理领域取得新进展，开发图像篡改检测技术，有效识别图片造假，广泛应用于金融、保险等行业。📱 骁龙8至尊版发布：开启终端侧生成式AI新时代高通发布全新一代旗舰移动平台骁龙8至尊版，性能和能效显著提升，小米15系列将首发搭载，各大手机厂商即将跟进。♟️ DeepMind国际象棋AI争议：推理能力成焦点DeepMind论文引发AI推理能力争议，Meta FAIR研究科学家质疑评估方法，凸显AI在复杂任务中推理能力评估难题。🌐 DeepSeek发布Janus：多模态统一模型新突破DeepSeek推出Janus模型，通过解耦视觉编码统一多模态任务，显著提升模型灵活性，成为多模态通用模型的有力候选。🏆 Maitrix.org发布Decentralized Arena：AI评估新基准Maitrix.org推出基于大语言模型群体智能的多维评估基准，通过去中心化系统避免评估偏见，提供透明可复现的评估结果。

10-22

05:15

2024.10.22 | AI 新闻速递

🌟 AI加速核聚变研究：预测速度提升1000万倍美国能源部普林斯顿等离子体物理实验室开发的新型AI模型，在等离子体加热预测中实现了前所未有的速度提升，为核聚变能源的探索开辟了新道路。💡 OpenAI影响力再放大：黄仁勋谈AI工程速度英伟达CEO黄仁勋强调OpenAI在AI领域的重要性，并指出AI工程实施速度的惊人进步，如马斯克在19天内完成超级计算机集群建设。🍎 苹果AI落后两年？内部员工揭露生成式AI差距苹果内部员工透露，公司在生成式AI技术方面落后行业领先公司两年以上，计划在2026年全面集成AI能力。🌐 智源发布Emu3：原生多模态世界模型引爆AI社区智源研究院发布的Emu3模型，通过预测下一个token实现文本、图像、视频的多模态理解和生成，被视为多模态AI领域的重大突破。📹 LLaVA-Video-178K：合成数据集助力视频多模态模型发展字节跳动等机构合作开发的高质量合成数据集LLaVA-Video-178K，显著提升了视频多模态大模型的理解能力，推动AI技术进步。🧠 Mamba推理能力受限：Transformer仍占优势北京大学和清华大学的研究揭示了Mamba等高效模型在推理能力上的局限性，提出通过增强局部性和引入上下文检索器来提升其能力。

10-21

04:00

2024.10.21 | AI 新闻速递

🔍 Meta发布AI新工具：推动高级机器智能发展Meta公司最新发布的SAM 2.1、Spirit LM、Layer Skip和Lingua等AI工具，旨在推动高级机器智能（AMI）的发展，进一步推动AI领域的开源研究和应用。💰 OpenAI与微软股权争夺战升级：资金与独立性成焦点OpenAI与微软因资金和独立性问题出现裂痕，微软寻求以140亿美元投资换取大量股权，OpenAI则争取更好的合同以推动AI大模型研发。🧠 MoEUT：混合专家架构提升Universal Transformer效率Jürgen Schmidhuber和Christopher Manning团队提出的Mixture-of-Experts Universal Transformers（MoEUT），通过优化共享层MoE架构，显著提升计算和内存效率，超越标准Transformer。⚡ SageAttention：8比特量化Attention算法实现推理加速清华大学陈键飞团队提出的SageAttention算法，实现了对FlashAttention2和xformers的两倍及2.7倍的推理加速，且在视频、图像、文本生成等大模型上未出现精度损失。

10-20

02:43

2024.10.20 | AI 新闻速递

🧬 蛋白质预测新纪元：双模型自适应权重融合网络引领生物信息学革命东北大学研究团队开发的TAWFN框架，结合CNN和GCN，显著提升蛋白质功能预测的准确性，为生物信息学领域带来重大突破。💡 AI推理速度飞跃：SambaNova RDU芯片挑战英伟达GPU霸主地位随着OpenAI的o1发布，SambaNova的RDU芯片在推理性能上超越传统GPU，成为AI芯片市场的新竞争者。🎓 学术界新星加盟：刘壮教授将引领普林斯顿大学AI研究新方向深度学习领域知名学者刘壮即将加盟普林斯顿大学，继续其在DenseNet和ConvNeXt模型上的创新研究，推动人工智能领域的发展。🧮 算术运算新突破：南京大学CAEF框架提升大型语言模型计算能力南京大学研究团队开发的CAEF框架，使LLM在算术运算中实现近乎100%的准确率，显著提升其在算术领域的应用能力。🤖 智能体评估新标准：Meta发布Agent-as-a-Judge框架Meta的Agent-as-a-Judge框架通过智能体评估其他智能体的表现，显著提升评估效率和性价比，为智能体评估带来新标准。💻 Windows版ChatGPT上线：OpenAI推出全新应用体验OpenAI正式推出适用于Windows系统的ChatGPT应用程序，支持文件上传、图像生成等功能，未来还将加入更多新特性。📚 科研利器上线：机器之心推出一键获取前沿AI论文服务机器之心推出的全新服务，帮助用户一键免费获取前沿AI论文，提升科研效率。🤖 双臂机器人新里程碑：清华大学开源RDT大模型清华大学TSAIL团队开源的RDT大模型，通过模仿学习实现多种复杂任务，成为全球最大的双臂机器人扩散大模型。

10-19

05:18

View All on Castbox

Recommend Channels