Discover硅谷101E217|机器人开可乐发扑克有多难?聊聊灵巧手的硬件与算法
E217|机器人开可乐发扑克有多难?聊聊灵巧手的硬件与算法

E217|机器人开可乐发扑克有多难?聊聊灵巧手的硬件与算法

Update: 2025-12-11
Share

Description



2026年,人形机器人将迎来规模化量产的元年。

最清晰的信号来自特斯拉,“金色擎天柱”Optimus Gen 3预计在2026年第一季度亮相,并计划在年底前建成产能高达100万台的生产线。马斯克曾多次表示,特斯拉未来约80%的价值来自这里,而非汽车。而“擎天柱”的攻关关键,正在于它的“手与前臂”。

灵巧手,堪称打开人形机器人能力上限的一把金钥匙。它的发展历程始终伴随着一场发散式的创新浪潮——学界、科技巨头与初创公司齐头并进,快速迭代,各有所长的格局依然活跃。

从发扑克牌、摆盘子到开可乐,这些炫酷的Demo只是冰山一角,如今,行业的焦点已悄然转向更硬核的深层挑战。



【主播】

泓君,硅谷101创始人,播客主理人



【嘉宾】

齐浩之,亚马逊&前Meta机器人研究科学家,芝加哥大学助理教授

陶一伟,TetherIA 创始人兼CEO,前Tesla Optimus高级机器人机械工程师



【本期口播由腾讯广告算法大赛赞助播出】

我们播客7月份做过腾讯广告算法大赛的招募,这场比赛在11月27日刚收尾,吸引了全球8400名技术人才、2800多支队伍参加。在这次比赛中,年轻人在用各种新方法解决多模态痛点:比如冠军团队用行为条件化建模,让算法更能“感觉”用户需求;有人去验证scaling law在生成式广告推荐模型里是否适用;也有人在数据安全前提下把性能继续往上推。可以说这个比赛是把全球顶尖技术人才聚集到一起,也反过来在推动广告算法的进步与系统性能,在AI时代,这类比赛可以让自己的能力被看见、也是让企业找到顶尖人才的最佳场景。



【你将听到】

Demo背后的虚与实

02:37 评估灵巧手能力的关键:精细运动、泛化能力与可靠性

05:58 “开可乐”Demo背后:演示效果与实际能力的差距

08:23 硬件厂商追求单项突破,算法团队更重泛化能力

15:32 灵巧手面临的瓶颈和独有的技术挑战是什么?



三大技术路线

19:26 连杆驱动:常见6自由度,也有高自由度方案(ILDA)

21:26 直驱方案:关节与电机一一对应,灵活度高(Sharpa)

24:59 绳驱方案:双向拉绳(Shadow Hand、ORCA)与单向拉绳(Tesla)

29:57 仿真研究为何更偏爱直驱方案?

33:13 天价灵巧手:不为盈利,只为筛选顶尖客户

36:21 Evan亲述:在特斯拉研发Optimus灵巧手的经历

40:33 从解剖学到外科观摩:马斯克坚持的仿生路线启发了“电机前臂迁移”

42:52 绳驱vs直驱:装配难度与量产前景对比



算法、数据、触觉

44:32 揭秘Meta机器人项目

48:25 受GPT与特斯拉FSD启发,机器人研究重心已转变

50:08 灵巧手数据采集为何难上加难?

52:01 机器人顶尖团队盘点:学术派与产品派

53:33 触觉如何提升灵巧手的操作能力?

58:11 灵巧手数据金字塔:遥操、仿真、视频

01:01:27 Genie3视频模型能用于训练机器人吗?

01:03:17 在伯克利做机器人研究是种什么体验?

01:07:09 灵巧手的“GPT时刻”还有多远?



【延伸阅读】

《机器人的“最后一公里”:深聊灵巧手的“不可能三角”与六大技术门派》

本期播客中提到的公司:

1X

ILDA

Shadow Hand

ORCA Hand

Sharpa

Figure AI

Tesla Optimus

Physical Intelligence(PI)

Sunday Robotics

Generalist

Covariant

TetherIA

源升智能



【监制】

泓君

【后期】

AMEI

【运营】

朱婕

【BGM】

The Light from Within - Howard Harper-Barnes

Floating in Space - Eva Hummingbird

All Parts Equal - Airae

The Secret Spring - Helmut Schenker



【在这里找到我们】

公众号:硅谷101

收听渠道:Apple Podcast|Spotify|小宇宙|喜马拉雅|蜻蜓FM|荔枝FM|网易云音乐|QQ音乐

其他平台:YouTube|Bilibili 搜索「硅谷101播客」

联系我们:podcast@sv101.net

Special Guests: 陶一伟 and 齐浩之.

Comments 
loading
In Channel
loading
00:00
00:00
1.0x

0.5x

0.8x

1.0x

1.25x

1.5x

2.0x

3.0x

Sleep Timer

Off

End of Episode

5 Minutes

10 Minutes

15 Minutes

30 Minutes

45 Minutes

60 Minutes

120 Minutes

E217|机器人开可乐发扑克有多难?聊聊灵巧手的硬件与算法

E217|机器人开可乐发扑克有多难?聊聊灵巧手的硬件与算法

硅谷101