2025.11.27 | 俄语多模态评测补空白；潜协作提速14%

Update: 2025-11-27

Description

本期的 15 篇论文如下：

[00:22 ] 🔍 Multimodal Evaluation of Russian-language Architectures（俄语多模态架构的评估框架）

[01:15 ] 🧠 Latent Collaboration in Multi-Agent Systems（多智能体系统中的潜在协作）

[01:47 ] 🌍 Inferix: A Block-Diffusion based Next-Generation Inference Engine for World Simulation（Inferix：基于块扩散的新一代世界模拟推理引擎）

[02:18 ] 🎭 Harmony: Harmonizing Audio and Video Generation through Cross-Task Synergy（和谐：通过跨任务协同实现音频与视频生成的统一）

[03:10 ] 📄 NVIDIA Nemotron Parse 1.1（英伟达Nemotron解析1.1）

[03:46 ] 🧠 Monet: Reasoning in Latent Visual Space Beyond Images and Language（Monet：超越图像与语言的潜在视觉空间推理）

[04:25 ] ⚡ Terminal Velocity Matching（终端速度匹配）

[05:03 ] 📊 Revisiting Generalization Across Difficulty Levels: It's Not So Easy（重新审视跨难度级别的泛化能力：并非易事）

[05:42 ] 🤖 MobileVLA-R1: Reinforcing Vision-Language-Action for Mobile Robots（MobileVLA-R1：强化移动机器人的视觉-语言-动作能力）

[06:25 ] ⚡ Image-Free Timestep Distillation via Continuous-Time Consistency with Trajectory-Sampled Pairs（基于轨迹采样对的连续时间一致性图像自由时间步蒸馏）

[06:59 ] 🎮 UniGame: Turning a Unified Multimodal Model Into Its Own Adversary（UniGame：将统一多模态模型转化为其自身的对抗者）

[07:47 ] 🧩 SPHINX: A Synthetic Environment for Visual Perception and Reasoning（SPHINX：用于视觉感知与推理的合成环境）

[08:33 ] ⚡ Block Cascading: Training Free Acceleration of Block-Causal Video Models（块级联：免训练的块因果视频模型加速）

[09:12 ] 🏙 RAISECity: A Multimodal Agent Framework for Reality-Aligned 3D World Generation at City-Scale（RAISECity：面向城市尺度的现实对齐三维世界生成多模态智能体框架）

[09:58 ] 📊 I-GLIDE: Input Groups for Latent Health Indicators in Degradation Estimation（I-GLIDE：基于输入组的退化估计潜在健康指标）

</figure>

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

Comments

In Channel

2025.12.02 | 代码智能四步落地；LongVT长视频精准理解

2025-12-0210:57

2025.12.01 | Z-Image小参高效夺冠；REASONEDIT先思后画登顶

2025-12-0109:33

【周末特辑】11月第5周最火AI论文 | 自适应正交稳训练；GAM代理即搜忆

2025-11-2911:54

2025.11.28 | 潜在奖励模型提速降显存；画布多模态生成碾压SOTA

2025-11-2804:47

2025.11.27 | 俄语多模态评测补空白；潜协作提速14%

2025-11-2711:03

2025.11.26 | 大模型育种进化框架开源；MedSAM-3听懂临床精准分割

2025-11-2611:05

2025.11.25 | 即时编译让记忆无损；AutoEnv自动挑环境提两成

2025-11-2510:01

2025.11.24 | 开源7B模型刷新多模态推理；GeoVista小模型精准地理定位

2025-11-2410:42

【周末特辑】11月第4周最火AI论文 | Kandinsky 5.0开源全家桶；MiroThinker开源智能体

2025-11-2210:19

2025.11.21 | V-ReasonBench考视频模型推理；Step-Audio-R1让语音越“想”越强

2025-11-2109:54

2025.11.20 | 视频模型拍推理链，迷宫百发百中；无标注左右互搏，视觉模型自学跃升

2025-11-2003:36

2025.11.19 | 像素演员难推理；视觉误导测真章

2025-11-1908:19

2025.11.18 | RL奥赛夺金；Uni-MoE 2.0全能跃升

2025-11-1810:08

2025.11.17 | RoPE去噪救长文本；AI速筛离子液体

2025-11-1710:06

【周末特辑】11月第3周最火AI论文 | 3D游戏智能体开源方案；桌面AI少样本精准操控

2025-11-1511:34

2025.11.14 | UniVA四合一开源视频通才；Depth Anything 3单ViT通吃3D

2025-11-1403:25

2025.11.13 | 原神数据炼成7B通用AI；零训练轨迹秒变视频遥控器

2025-11-1306:28

2025.11.12 | 1.5B小模型反超671B大模型；多智能体质检聊天机器人

2025-11-1206:56

2025.11.11 | 小窗口勤总结刷新深度研究；先广撒网再啃难题激活代码竞赛

2025-11-1109:58

2025.11.10 | DeepEyesV2小模型边看图边写代码；纯数据让AI长出立体眼

2025-11-1005:30

00:00

2025.11.27 | 俄语多模态评测补空白；潜协作提速14%

#box-pro-ellipsis-176473481762152{-webkit-line-clamp:2;}2025.11.27 | 俄语多模态评测补空白；潜协作提速14%

2025.11.27 | 俄语多模态评测补空白；潜协作提速14%

2025.11.27 | 俄语多模态评测补空白；潜协作提速14%