Discover晚点聊 LateTalk
Claim Ownership
89 Episodes
Reverse
移动互联网降低分享门槛,生成式 AI 降低创作门槛。
本期《晚点聊》,关注当技术遇上艺术,聊一聊计算机技术和正蓬勃发展的 AI 技术,如何与 M&E,也就是 Media and Entertainment 媒体娱乐产业相互影响、相互塑造。
围绕这个话题,我们邀请了两位嘉宾一起对谈:一位是 NVIDIA 中国区高级技术市场经理施澄秋(Searching),另一位是新片场的董事长兼 CEO 尹兴良(Ethan)。
他们刚好站在技术塑造内容这个链条的两头:NVIDIA 是人工智能计算领导者,同时 NVIDIA 也会开发大量的软件去帮整个生态更好的使用 GPU。NVIDIA 起家就是依靠计算机图形技术,最初也主要是用在游戏和影视行业。
成立于 2012 年的新片场,则是中国最大的高质量短片和视频素材分享平台,此后也进入制片业务,制作了大热 IP 剧集《鬼吹灯》(怒晴湘西、精绝古城、南海归墟等)系列。
内容创作或者说讲故事,是人类文明最早的活动之一。在 AI 技术之前,这个行业已是一个有长链条的技术工业体系。本期节目中,我们回顾了 AI 之前,计算机图形等技术对内容制作的影响与渗透,进一步展开了生成式 AI 浪潮带来的新变化。
如果说移动互联网大大降低了分享内容的门槛,生成式 AI 的发展则将进一步缩短从创意到表达的距离,让更多人有表达自己的方便工具,未来还可能进一步衍生出新的社区与平台。
影视和内容行业是一个万亿级的全球大市场,AI 带来的新一轮变化才刚开始。
时间线传送:
· AI 之前,影视内容工业已高度技术化
02:07 《南海归墟》怎么制作?重特效剧集的基本生产流程
03:45 从前期概念图到特效拍摄、后期制作,计算机技术已在影视多环节降本增效
04:57 LED 拍摄从昂贵到普及,新版《狮子王》重映,GPU 让光影毛发的更精细渲染成为可能
11:16 从千禧年到现在:拍摄、制作的技术变革
· 移动互联网降低了分享门槛,生成式 AI 将降低创作门槛
22:04 打开视频软件,也许你已经看到过大量 AI 生产的短剧海报
28:09 一个实用案例:NVIDIA Omniverse,数字资产在线协作平台如何提高影视拍摄的效率
32:41 制作方视角:不怕技术新,怕找不到熟练使用的人
35:51 生成式对抗网络(GAN)、NeRF (神经辐射场)、ACE 数字人,前沿技术渗透影视行业
39:48 2021 年 NVIDIA GTC 大会中,黄仁勋“数字分身”的台前幕后
48:45 新片场与国内 AI 厂商有多元合作:即提供训练素材,也在测试、使用各家的模型
50:40 渲染器领域的国产替代机会,D5 已被很多中国团队使用
52:55 Maxine 软件,在网络会议场景实现的眼神聚焦和画面校准功能,使得远程交流更加自然流畅
54:22 大型网络会议、户外直播等复杂场景如何实现高质量流程
57:10 NVIDIA 有两个不直接“带货”,却被黄仁勋视为核心的团队:“开发者关系”和“开发者技术”
59:29 Ethan 的 NVIDIA 总部参访感受
· 工具与灵魂:“内心的想法是一切的根源”
01:02:34 AI 的魅力在于降低创作门槛,普通人也能通过科技工具更好表达创意
01:05:25 NVIDIA Omniverse 的创作者比赛,已涌现出许多优秀的非专业创作者
01:06:21 AI 创作需要数字围栏,人类的意图表达更为重要
01:07:46 教育端已出现学科调整,AI 会催生更多新岗位
01:08:48 普通人拥抱 AI 创作,创作热情和想法仍然是最重要的
01:10:06 AI 可以打动人类,但是不会被打动,人类情感仍然是推动内容创作的本源动力
相关链接:
一位 AI 画家的成长历程丨TECH TUESDAY (https://mp.weixin.qq.com/s/3-ohroApUiMZbSR2MnsNJQ)
争夺 AI 入场券:中国大公司竞逐 GPU (https://mp.weixin.qq.com/s/wGTysc-dTxFfiDk4yHytMg)
附录:本期播客里提及的技术与产品等
M&E
Media and Entertainment 的缩写,指的是媒体与娱乐产业。
特效回插
在影视剧的生产链条中,特效镜头常常由协力公司单独制作,后期制作阶段会将这些特效镜头插入到影片中相应的位置。
CG
计算机图形学(Computer Graphics,简称CG)是一种使用数学算法将二维或三维图形转化为计算机显示器的栅格形式的科学。
Diffusion 模型
这是一种生成式模型,主要用于生成高质量的图像、文本和其他类型的数据。
B-roll
是指在影视制作中用来补充主镜头(A-roll)的辅助视频或图像素材。通常,A-roll 包含主要的叙事内容,比如采访、对话等直接涉及故事主线的画面。而 B-roll 则是用来丰富视觉效果、提供背景信息或增强情感氛围的额外镜头。
NVIDIA Omniverse™
是一个提供 API、SDK 和服务的平台。借助此平台,开发者可以轻松地将通用场景描述 (OpenUSD)和 RTX 渲染技术集成到现有软件工具和仿真工作流中,以构建 AI 系统。
NVIDIA ACE
即 Avatar Cloud Engine,是一套可帮助开发者利用生成式 AI 创建栩栩如生的虚拟数字人物的技术。
SIGGRAPH
是由 ACM SIGGRAPH(美国计算机协会计算机图形专业组)组织的计算机图形学顶级年度会议。
RAG
即检索增强生成(Retrieval-augmented Generation),简称 RAG。检索增强生成是一种使用从外部来源获取的事实,来提高生成式 AI 模型准确性和可靠性的技术。
登场人物:
施澄秋 Searching,NVIDIA 中国区高级技术市场经理
尹兴良 Ethan,新片场的董事长兼 CEO
程曼祺,《晚点 LatePost》科技报道负责人(即刻:曼祺_火柴Q)
剪辑:阿鲸Hval
封面:NVIDIA 创始人兼CEO黄仁勋的“数字分身”Toy Jensen。现在,新的生成式 AI 技术可以让数字人的生成过程更简单、低成本、高效。
图片来源:NVIDIA
“为什么要太空旅行?” “因为很酷呀!”
由马斯克创立的 SpaceX 在前 10 月 13 日完成了星舰(Starship)的第五次试验发射。马上又会在 11 月 18 日进行第六飞。
我们邀请了中国某家商业航天公司的前总体设计师陈亮,来与我们一起聊一聊取得重大进展的“星舰第五飞”。陈亮是北京航空航天大学航空宇航推进理论与工程博士,主要研究液体火箭动力系统的流动传热问题,曾参与多项新型飞行器热防护技术攻关和相关国家级预研项目,曾任可重复使用商业运载火箭总体副总师。
https://cdn.z.wiki/autoupload/20241107/NSl4/1280X1648/-128596214-spaceship-and-docking-towerv2-2-nc.png.webp
(图片来源:BBC)
我们也会就此展开 SpaceX 的研发逻辑,它作为商业公司给航天领域带来的变化,以及中国近年来商业航天领域的一些实践。
陈亮提到,他和很多同行其实没有预料到,星舰这次正式回收 Super heavy ,能如此完美地成功,如此干脆利落,好比在 100 公里时速下,精准倒车入库。Super heavy 就是星舰的推进器部分,星舰第五次实验发射的最大进展,就是成功地用像筷子一样的发射架塔臂稳稳夹住了掉头回到地面的 Super heavy 推进器。
星舰的全部模块可回收,意味着将进一步大幅降低发射成本,包括制造成本和发射时间成本。
https://cdn.z.wiki/autoupload/20241107/rDIy/975X1280/1280X1280_%281%29.PNG
低成本,也是 SpaceX 高频发射、快速迭代的前提。低成本和高频次相辅相成,打破了航天业过去奉行的“像飞行那样去测试,像测试那样去飞行的原则”。
SpaceX 的逻辑不一定谁都合适模仿,但这个搅局者已带来实实在在的改变。
时间线传送:
·星舰第五次发射: “即便成功,也没想到是如此完美的成功”
03:02 星舰的整体任务要求:一子级(推进器 Superheavy)回收到发射场,二子级(Starship)部分海上溅落
04:14 一般火箭的组成;星舰其实已超出传统火箭的范畴:介于火箭和航天飞机之间
06:32 火箭从准备到点火、发射、着落的几道关卡
09:06 看直播:超出预料;“即便成功,也没想到是以这种方式成功”
12:08 Starship 的软着陆:第四次跌宕起伏,第五次热防护做得更好
15:18 SpaceX 的逻辑:低成本+高频次发射=快速迭代;传统航天业则是:像飞行一样测试,像测试一样飞行
17:42 不建议初创公司模仿 SpaceX,猎鹰的失败当年也差点拖垮公司
19:56 蓝色起源的标志是乌龟,它相信快就是慢
21:40 NASA 新火箭项目 SLS,从项目上不成功,但它是满足美国载人登月时间表的唯一火箭
24:15 马斯克也许很疯狂,但 Space Age 时更疯狂:二战末期人类还开着螺旋桨飞机开战,69 年就登上了月球
27:58 科学狂人的激进:FAA(联邦航空管理局)一度推迟星舰发射,马斯克试图在特朗普上台后主持技术发展提效部门
32:07 在 SpaceX 做研发,得文武双全、不恐高
·SpaceX 的航天矩阵:猎鹰、星舰、龙飞船、星链
33:00 猎鹰+龙飞船的组合:为空间站送货、送人
34:20 美国一度不能送人到空间站,要靠俄罗斯
35:08 美国两位宇航员仍滞留空间站;SpaceX 没去接,因为 NASA 没钱接
36:30 星舰和猎鹰的区别:星舰是为了去火星;目前方案需要在近地轨道 5 次加注燃料
38:20 火星不一定有经济价值,但太空旅行很酷
39:33 人类去火星,马斯克说 5 年,悲观看 10 年,NASA 的设想是 2050 年
41:46 星舰降成本的法宝:回收+使用民用部件+培养多面手
45:40 SpaceX 一个结构工程师,可以既做火箭结构也做卫星结构
47:51 全球火箭发射竞争格局:中美最强,欧洲最近扶持力度增大
·中国的商业航天实践
50:51 2010 年到 2020 年,中国航天陆续启动重要项目
51:52 北航的“宇航学院”每年招生在 150-160 左右,近年 60%-70% 毕业生进入航天业
53:03 中国空间站发射、嫦娥五号探月工程、天问火星探测器,近年中国航天成果密集
55:18 商业航天公司能让个人更快速、全面成长,但整体人力资源有限
58:30 中国商业航天和 SpaceX 的差距——中国公司取得 Milestone 的时间更短;政策支持+航天基础+人才储备是只能怪过的优势
01:00:54 但 SpaceX 也在指数级发展,星舰出世开启新一轮追赶
01:01:41 从 SpaceX 身上学到的:回收模式+工程实现的启发
01:02:02 SpaceX 并未公开任何图纸,它的开放在于不会追究学他的人
01:03:09 从 SpaceX 获得启发的例子--猎鹰回收时的辅助支撑腿
01:05:12 中国商业航天发展需要的更多支持——资金+更多容忍失败;国内管理部门现在已经有很多支持
01:07:40 平民进入太空会成为趋势
相关链接:
星舰成功发射,SpaceX 如何在美国打败航天旧体系 (https://mp.weixin.qq.com/s/H7yUUmIJQb1uiT9cdhJrGg)
登场人物:
陈亮,中国商业航天公司前总体设计师
程曼祺,晚点 LatePost 科技报道负责人(即刻:曼祺_火柴Q)
剪辑:甜食
扫帚、吸尘器、扫地机器人,为什么还不够?
近年来,消费电子市场不断出现一些新品类,骨传导耳机、洗地机、vlog 相机、智能眼镜等等,这些新品开始在市场上找到了自己的位置,也带动消费电子市场复苏。
每年都会有新品出现,但最终能被市场接受的不多。一个新的消费电子产品品类是如何出现的?它要满足哪些条件才能在市场上立足?
本期《晚点聊 LateTalk》由云鲸智能赞助,我们邀请了云鲸洗地机产品线负责人庄彬来分享一款新消费电子品从 0 到 1 的诞生过程。
庄彬是消费电子行业资深从业者,曾领导扫地机器人、智能洗地机、消费无人机、云台、激光雷达等多款、多品类的产品研发工作。2021 年加入云鲸,孵化了云鲸洗地机品类线。2023 年 5 月,云鲸正式发布第一代洗地机 S1,今年 9 月又正式发布第二代洗地机 S2 Island 光辉版。在整个中国洗地机市场,云鲸今年 9 月的市占率首次跻身前三。
洗地机在吸尘器、传统清洁工具和扫地机器人的夹缝里生长,它的市场规模从 2019 年的 0.9 亿快速增长到了 2022 年的 100 亿。
我们与庄彬聊了他近几年印象最深的消费电子新品,为什么行业不断有新的消费电子产品出现,他们满足了怎样的需求,一家消费电子公司是如何调研需求、拆解需求、立项并把产品做出来,以及云鲸的产品理念是如何在洗地机这款产品上落地的。
消费电子行业一直以来最核心的理念就是 PMF 产品与市场的匹配,云鲸作为一家年轻的公司,成立几年时间就就切入扫地机器人主流市场。他们的经历与思考对于行业可能是一个参考。
时间线传送:
·新的消费电子品类如何产生
01:48 印象最深的几款新的消费电子品类
03:58 消费级无人机为什么能成功
07:01 成功的消费电子品类满足什么条件
07:49 不成功的案例,创新没有匹配需求
·调研→立项→研发全流程
09:45 立项前最重要的几个问题
11:32 产品经理如何分辨真伪需求,如何给需求的重要性排序
13:12 要去挖掘用户表面需求背后真正的底层需求是什么
15:23 云鲸怎么解决洗地机毛发缠绕的问题
·洗地机为什么会出现,解决了什么需求
18:17 洗地机是一个舶来品,最早是清洁海外用户的毛毯地面
20:56 疫情期间智能清洁产品火爆
23:44 洗地机是取代吸尘器,和扫地机器人不冲突
29:00 云鲸为什么做洗地机比较晚
·个人经历与转型,从研发转型产品的经历与思考
32:51 为什么从研发转型为产品经理
35:52 最初怎样规划这款新的洗地机产品
·清洁产品的未来
45:27 智能清洁产品共同面对的问题
47:43 最终会有一个终极的清洁产品出现,类似通用机器人
51:59 给产品新人的三点建议
相关链接:
新新访谈|云鲸张峻彬:只有创始人走出低谷,公司才能走出来 (https://mp.weixin.qq.com/s/glpKVrNBs5gdQnRlR578Hg)
本期人物:
庄彬,云鲸洗地机产品线负责人
张家豪,晚点科技报道作者,即刻:Erlade
剪辑:
甜食
https://image-qiniu.jellow.site/FiLbAz0YzedVJ-l1v7MzB7Z6MI-Q.jpeg
“人类最大的科学幻想之一,怎么一点点变得现实。”
今天的节目还是和特斯拉近期的 We,Robot 发布会有关,主角从与侯晓迪那期(见《晚点聊》ep84 (https://www.xiaoyuzhoufm.com/episode/670eeed1b5509a9cfb6319d2))聊的自动驾驶来到另一个全场焦点:特斯拉人形机器人 Optimus。
我们邀请了清华大学交叉信息研究院助理教授、同时是清华叉院具身智能实验室负责人许华哲来与我们分享他的观察和实践。去年开始,许华哲也参与创立了一家具身通用机器人公司——星海图。
许华哲本科毕业于清华大学电子工程系,在伯克利 AI Research Lab(BAIR)获得博士学位,后在斯坦福做博士后,2022 年回国加入清华大学交叉信息学院。博一做过自动驾驶后,他在博二开始关注机器人领域,伯克利也是较早尝试把强化学习和机器人结合的重镇之一。
这期节目里,我们从 We,Robot 发布会出发,解释了有争议的“遥操”到底是什么,现在有什么用;许华哲也详细介绍了这次具身智能变革的一些关键技术推动因素,如强化学习、模仿学习、多模态大模型、世界模型等等;他还分享了 BAIR 的教授与博士生的工作方式。
通用智能机器人是一个交叉学科,也是人类最大的科学幻想之一。AI 知名学者 Marvin Minskey(马文·明斯基)曾预测, 3-8 年后,我们就会看到通用智能体,不过他说这话时是 1970 年。新一轮 AI 热潮为何会不同?最前线的人提供了他们看到的可能。
时间线传送:
·许华哲的求学经历
01:04 从清华电子系到伯克利 AI Research 博士,再到斯坦福博后
02:10 三在多伦多大学交换,机缘巧合下开始接触 AI 研究。
·WeRobot 上的 Optimus,到底怎么理解遥操?
04:50 很马斯克风格的发布会
05:40 丝滑遥操作也有实用价值:远程劳动力转移;同时能帮助获得更多数据,使系统进化。
06:46 判断机器人好不好的两个小 trick:机器人走路时,周围人越少越好;机器人操作使,周围人离机器人越近越好
07:51 遥操目前有三种常见方式:从视频映射、人带着 VR 设备遥操、用与机器人同构的专用遥操设备遥操,斯坦福 Aloha 就使用了第三种
10:01 从遥操到机器人自己动需要:更多的数据,更好的模型
12:47 马斯克拉高大众对机器人的期待,整体是好事,但专业人士也许有时生气——2017 年的一个活动中,马斯克大谈明年实现自动驾驶,Andrej Karpathy(特斯拉自动驾驶前负责人,后回到 OpenAI,今年自己创业了)“脸都绿了”
·通用具身机器人照进现实,变化并不始于 Optimus
-强化学习、模仿学习和多模态大模型
14:56 伯克利 AI Research:较早关注强化学习;这里鼓励一起合作,不同老师和博士间自由组合,很适合机器人交叉领域
20:28 斯坦福、伯克利、MIT 机器人谁最强?美国高校的人才的轮动机制
21:41 一个标志性工作:ETH(苏黎世联邦理工)让机器狗在仿真环境里学会爬山,这是是强化学习在机器人中的应用
23:37 许华哲自己的项目:机器狗学会在软垫上走,通过改进一个强化学习算法,让机器人不是在仿真里学,是在真实环境里学
25:20 算法和模型架构是两个概念,同一个算法可用不同架构的神经网络实现;强化学习两个最典型的算法范式:基于值的学习(Q学习)和基于策略的学习。
28:51 接下来谁能做出非常有效果的“具身大模型”,会是一个进展
29:23 除了强化学习,其它重要进展:模仿学习、多模态大模型 & 三者的不同作用
32:54 目前具身智能公司,自己做强化学习、模仿学习多,多模态大模型一般使用外部的,如 GPT 等。
-世界模型
34:11 目前是个笼统概念——根据目前状态能推断未来状态,都可以是世界模型
35:24 为什么 Sora 不是世界模型,而 YX (也是一个视频模型)是一个世界模型?
36:52 机器人包饺子的例子:当时用到的“世界模型”就是一个神经网络,不过是一个很局限的版本。
38:04 实现通用机器人,世界模型一定是组成部分,但其实现在大家并不完全知道怎么做世界模型;目前 AI 界提出的几种主要思路
-触觉(感知里被忽略的一个部分)
39:14 触觉是个被忽略的模态,而人最大的器官是皮肤;触觉缺失的患者很难抓东西
41:00 触觉和力控传感的区别
-本体
42:29 机器人本体形态目前五花八门,为什么星海图觉得当前操作(双臂)更重要
45:28 关于灵巧手:在清华有各种尝试,但并不适合现在就放在公司里做,要做好灵巧手,难度不亚于做好一个完整人形机器人
47:53 目前星海图“力出一孔”要做好的事:移动操作的本体、遥操作和智能。
·从机器人的现在到未来
48:19 明斯基 1970 年的乐观,3-8 年后就会有通用智能体
49:26 清华姚班本科生关于 AGI 的预期小调查:今年比去年悲观
52:03 从现在到未来的瓶颈:数据;目前行业里还没有清晰的数据采集成本,因为采集方法也没有定型;星海图自己获得数据的 3 种方式
55:30 未来机器人上的模型,是一个端到端大模型,还是在不同层次用不同模型来组合?——许华哲相信类似 VLA 的端到端模型是未来趋势,但不一定最适合现在来落地。
58:14 目前大模型范式有缺陷,但可以一边先用,一边改进
59:07 UBI(无条件免费发钱)计划不一定能解决未来的社会危机
59:51 要警惕人类不经意间丧失权利,你有可能失去“在健康日吃炸鸡的权利”
01:02:17 一致性与对齐:机器以会实现我们设定的目标,但可能以我们想不到的方式,使我们付出想不到的代价
相关链接:
特斯拉 Optimus 机器人进展:已经生产数百台、还拧不好螺丝 (https://mp.weixin.qq.com/s/jVxopXkmFYzU5MDk_qqcJw)
到底什么时候AI才能帮我把麻烦事都做了啊啊啊啊?|许华哲 一席第1037位讲者 (https://mp.weixin.qq.com/s/DmHHn8pfrNIqgsoiBzLvfQ)
晚点聊 LateTalk-84:与侯晓迪聊特斯拉 We,Robot:烟雾与现实 (https://www.xiaoyuzhoufm.com/episode/670eeed1b5509a9cfb6319d2)
附录:播客中提及的一些 AI 领域人物(按提及顺序)
Andrej Karpathy,AI 研究者,曾任特斯拉自动驾驶负责人,今年创立了人工智能教育公司 Eureka Labs。
Trevor Darrell,Berkely AI Research Lab(以下简称 BAIR)教授,Caffee 的搭建者之一,许华哲的博导。
Sergey Levine,BAIR 副教授兼谷歌 DeepMind 研究员,今年参与创立研发机器人大脑的 PI。
Pieter Abbeel,BAIR 教授,智能协作机器人 Covariant 的创始人之一,2021 年 ACM 计算奖获得者,Amazon 后收购了 Covariant 的部分团队。
Anca Dragan,BAIR 副教授,运营 Interact 实验室。
Jitendra Malik,BAIR 教授,其团队在机器人视觉触觉结合等方面有突破。
Alexei Efros,BAIR 教授,计算机视觉专家,在图像合成、风格迁移等方面成果突出。
Chelsea Finn,斯坦福助理教授,研究智能体学习交互能力,曾在谷歌大脑工作。
Yann LeCun,图灵奖获得者,Meta FAIR(the Foudamental AI Research)负责人。
David Ha,AI 研究者,2018 年 3 月曾发布论文“World Models” (https://arxiv.org/abs/1803.10122)
Marvin Minskey,麻省理工教授,“人工智能之父”,推动 AI 早期发展的重要学者。
Dieter Fox,华盛顿大学教授,研究机器人感知规划学习等,对复杂环境应用有贡献。
登场人物:
许华哲,星海图联创、清华交叉信息学院助理教授
程曼祺,晚点科技报道负责人。即刻:程曼祺_火柴Q
剪辑:甜食
封面:Screenshot from Robert Scoble on X
丰泽汉洋空口从零模拟国家工业化:泽洋波利斯的崛起之路!开局 5000 万人口、资源有限、生育率极高,该如何夺取天下?
建议点赞收藏转发,以后你和朋友穿越到异世界建国的时候能用的上。
晚点聊新系列,工业化之路第一期节目。
相关资料:
想要发电,要先有电:一个总工在中国和非洲修水电站的故事 (https://podcast.latepost.com/21)
国在水电站方面基本上处于天顶星级别存在:和非洲回来的曹工唠唠 (https://podcast.latepost.com/31)
人民币上的水电站,为啥炸了重建?清北打灰佬,探访「水电站之母」【吉林·丰满大坝】 (https://www.bilibili.com/video/BV1RF411p762/?vd_source=8eaa4434e945c74666fd06077daa6af2)
【番外】没人能在钢铁厂想小事儿:伯利恒 (https://shanyouhu.xyz/side1)
登场人物:
丰泽:在非洲打了三年灰的博士
汉洋:万古长风,一朝风月
制作:甜食
封面:汉洋拍摄于七台河
「一切以 CPM(每英里综合运营成本)为纲。」
本期《晚点聊 LateTalk》,我们邀请无人驾驶资深从业者侯晓迪探讨刚刚结束的特斯拉无人出租车(Robotaxi)发布会 We,Robot。
侯晓迪本科毕业于上海交通大学,后在加州理工大学获博士学位。他曾是自动驾驶第一股,图森未来的联合创始人,历任 CTO、CEO 和董事长。去年他开始了新创业,成立 Bot Auto,继续做自动驾驶。
马斯克式爽文的惯常叙事是:提出一个不切实际的想法→给出一个激进时间表→苦苦挣扎、多次延迟、陷入绝望→最后绝地反击。
无人驾驶也不例外,2016 年至今,特斯拉已数次跳票承诺。但今年初开始,特斯拉的一系列进展让外界期待大增,尤其是 FSDv12 的惊艳表现。
但 10 月 10 日的这场发布会,信息过于模糊,它短期带来的更多是失望:发布会第二天,特斯拉股价下跌约 9%,Uber 则大涨 10%。
侯晓迪说,这次发布会使他略感意外之处是,在全无人驾驶领域,部分人对马斯克的宗教式狂热正在减弱。
侯晓迪分享的核心观点是:L4 自动驾驶现在更多是一个多个问题组合而成的复杂系统工程,目前到了以 CPM(Cost Per Mile),即“每英里综合运营成本”为指引的阶段。
各公司的关键赛点,是怎么在保证安全的情况下降低 CPM,从而能比现有运力网络更有优势。马斯克在发布会中也提到了 CPM 这一指标,不过侯晓迪非常不同意马斯克说的具体数字。
我们也与侯晓迪聊了他对自动驾驶行业近年的一些热点技术,如「端到端」和「世界模型」的理解和看法;以及他在离开图森之后,再次创业做 L4 自动驾驶的新认知和选择。
时间线跳转:
·We,Robot 发布,马斯克的现实扭曲力在减弱
04:07 人们对 Musk 的宗教式狂热在消退
07:10 高科技发展中始终有两面,技术客观规律 VS 公众意志与期待,特斯拉擅长拉满期待
10:29 0.2 美元每英里运营成本为何是胡说,一个简单的计算题
12:13 CPM(每英里成本)应该是一个统一标准,就像会计准则
16:31 运营的魔鬼在细节,一个例子:胎压检测
19:26 Cruise CEO 发布会前给出 15 条要点,马斯克则都没讲
22:40 技术发展和 CPM 下降并不矛盾
26:14 机器人的遥操:从大众到业内人士的 3 层观点
29:07 Robotaxi 领域闯入新玩家的影响——也许没那么大影响
·认可端到端大方向,不认可技术被宗教化
30:55 FSD 休斯顿体验,运气好 10 分钟接管一次
31:10 端到端,是一种技术的“意识形态化”
34:50 Scaling Laws 原初论文里有诸多限定条件,愚者的问题是无节制地外推
38:31 端到端的新网络架构有优点,也增加了限制因素,如不可解释→难以合规
41:41 车主的车撞死了人,算谁的?——Cybercab 量产前,用 Model 3、Y 接单的“Airbnb”模式也难以实现
42:29 ”世界模型“,学术上的更早源头是内蕴表征
47:48 世界模型要解决的问题:包含各种物理规律,因而是一个做具体任务的宝箱
49:56 L5 是永远达不到的地平线,L4 是产品,产品就谈挣钱,不寒颤。
51:50 赚钱路上的眼见瓶颈:远程遥控 1:3 怎么走到 1:10
·从硅谷到休斯顿,远离 Breaking News Overflow,靠近产品和运营
53:21 Bot Auto 的 2000 万美元融资,什么人还愿意投入自动驾驶?
57:17 回顾上段创业:不要过早扩张,重要的不是收入,而是利润
01:01:32 休斯顿 VS 硅谷,离投资人和喧嚣远了,离产品近了
01:06:46 Bot Auto 年内小计划
相关链接:
《马斯克 19 分钟发布会,PPT 是一回事,现实是另一回事》 (https://mp.weixin.qq.com/s/VbPwkr9TTvbt8xNvUYmWDw)
15 key things to look for from new robotaxi players(Kyle Vogt) (https://x.com/kvogt/status/1844469409471176943)
(Robotaxi 新玩家需要注意的 15 个关键点——Cruise CEO Kyle Vogt)
登场人物:
侯晓迪,Bot Auto 创始人 & CEO。
程曼祺,晚点科技报道负责人。即刻:程曼祺_火柴Q
剪辑:甜食
与人类学者袁长庚聊“文科生”赫拉利的技术观察。大历史下,也可寻找小空间。
封面:一战中的英雄军鸽谢尔·阿米(Cher Ami)。赫拉利用阿米的例子说明了故事和人造符号如何深入人心,甚至改变了当事人的记忆。
这是一期串台节目,感谢中信出版旗下中信书院的播客《知本论》 (https://www.xiaoyuzhoufm.com/podcast/63abaed14ded9d81d0a11d46)的邀请,我和知本论主播孙冰洁,一起与人类学家袁长庚聊了尤瓦尔·赫拉利的新书《智人之上》。
https://cdn.z.wiki/autoupload/20241010/gIIY/1824X1358/%E6%88%AA%E5%B1%8F2024-10-10_15.00.08.png
袁长庚是香港中文大学人类学博士,先后任教于南方科技大学和云南大学。他从自己的角度简单总结了这本书和赫拉利的写作与论证思路。赫拉利擅长“大历史”写作,甚至被批评立论先行,这被学院派的研究者警惕,但他的洞察和担忧常常直击要害。
在《智人之上》这本新书中,赫拉利提出的问题是:人类要如何应对信息网络里人工智能这个空前强大的新变量?我们如何避免人工智能的失控?
在这次对谈的开端,赫拉利抛出的问题仿佛是无解的,他在《智人之上》的结尾提出了一个设想:提前构建一个有制衡机制的信息网络;这有些书生意气,缺少执行路径。
而随着对话深入,我们更多聊了个人可以做什么,袁老师对身边学生、年轻一代的观察,他从深圳到云南的新生活和感受,都给了我们书之外的更多联想和启发。
其中最重要的一点可能是——哪怕没有新的 AI 技术,寻找意义也是每个现代人都要解的一道题。这与我们的上期播客《人活着有啥意思》 (https://www.xiaoyuzhoufm.com/episode/66f5eca3c76d6d1101b4dd1d)形成了有趣的互文。
研究近代军事史出身的赫拉利是一个“文科生”,人文学者的技术评论会不着边际吗?也许恰恰是跳出学科分类抽屉的赫拉利,会有更锋利的目光。归根结底,技术总与人相关。
《知本论》已上线《智人之上》的电子有声书,可点击链接:https://www.xiaoyuzhoufm.com/podcast/66de6cffee04007d8826f53e
https://cdn.z.wiki/autoupload/20241010/ebGZ/1566X789/WechatIMG1109.jpg
此次串台中,《知本论》的节目直接从延展讨论部分开始,《晚点聊》这期也放了更多有关《智人之上》书籍本身的介绍和讨论。
时间线传送:
·《智人之上》,一部信息简史
02:47 《智人之上》的三段论:赫拉利对人类信息网络的观察+当 AI 新变量进入信息网络+警示与提醒
12:45 人文学科出身,但赫拉利有立场谈技术和 AI
17:23 赫拉利是一个“跳出抽屉”(学科分工)的人
21:02 科学家的天真:可能过于简单地理解了技术和社会的关系
·身边的信息观:天真的 VS 民粹的
23:36 身边的“天真信息观”:更多的信息,反而带来了更低的信息素养
28:26 “不反思”也许才是自在状态,信息里存在错误、盲目是人性使然
31:10 “民粹信息观”和“天真信息观”的一体两面
36:41 赫拉利也许夸大了 AI 的能力,但即使没有 AI 进化,新技术对信息网络的影响已是一个真实命题
40:42 韩国换脸事件、东欧小镇女孩的遭遇,事情为何难办
·哪怕没有人工智能,找到意义也是一个挑战
44:58 担忧“被取代”,本质是现代性之后难寻意义感
47:51 用工作来建构意义和“我是谁”的认同,这不是历史常态
51:56 种咖啡、种大米,重新建立身体与世界的连接?
55:31 一场“假葬礼”,如何让学生选定了工作 offer
58:23 不要轻易让渡权利,妙鸭的风波
59:47 沉溺“社交网络”,这也许是阶段性现象
01:05:29 从云南到深圳,云南人身体里有另一个闹钟
01:12:27 技术快速变化,我们可以做什么“日课”
相关链接:
《知本论》 (https://www.xiaoyuzhoufm.com/podcast/63abaed14ded9d81d0a11d46)此前已经与人大新闻系教授刘海龙,和复旦国际关系学者包刚升,从信息和大国竞争等角度聊了《智人之上》。大家如果对这本书和它讨论的议题有更多兴趣,可听相关节目,补充更多视角:
关于“意义感”的更多讨论:
晚点聊 LateTalk-e82:人活着有啥意思 (https://www.xiaoyuzhoufm.com/episode/66f5eca3c76d6d1101b4dd1d)
关于 “AI 威胁论”的更多讨论:
晚点聊 LateTalk-e71:对谈港大计算机系主任马毅:如果相信只靠 Scailing Laws 就能实现 AGI,你该改行了 (https://www.xiaoyuzhoufm.com/episode/6668d95ebb0f9563f6302495)
登场人物:
袁长庚,人类学者。
孙冰洁,知本论主播。
程曼祺,晚点科技报道负责人。即刻:程曼祺_火柴Q
剪辑:甜食
「大家都是牛马,凭啥你加夜草」——轶轩
和节目的老朋友丰泽聊聊人活着有啥意思,可以算是和王小伟老师那期《每个人活着都难受》那期的另一个版本。大部分问题想清楚很简单,想开了很难。意义的神圣感和吃饭喝水一样,是人的刚需。人活着有啥意思不是个虚无缥缈的问题;尤其是当代社会充斥着各种各样的「以工代赈」,工作意义早已被掏空。但人的价值不(光)是靠工作体现的。评价指标出了问题,不是人出了问题。
相关链接:
每个人活着都不舒服 (https://podcast.latepost.com/69)
圣山与山 (https://shanyouhu.xyz/2)
没有签证怎么去非洲干活:和丰泽聊聊在非洲不同国家打灰的体验 (https://podcast.latepost.com/46)
是理想也是现实:一个清华博士的非洲选择|文化纵横 (https://mp.weixin.qq.com/s/BDYm_nZZsoy25QppUuKmrA)
登场人物:
丰泽:海洋于他们而言如同河流
汉洋:现前一段西来意,一片西飞一片东
后期:甜食
封面:烟火,汉洋拍摄于日本
汉洋和重轻借着聊小红书,谈了谈游戏社区这件事。但这期节目的内容可能和你想的不一样——他俩没有聊游戏社区是什么,而是就着游戏社区谈了一个更大的问题:游戏是如何从一项简单的娱乐活动,变成了生活本身?并且接着游戏社区这个话题,分析了一下到底什么是社区。不过因为这期节目录制的比较早,所以没聊到黑神话。
这期的 shownotes 里没有时间节点,是因为这期节目整体上就是一场逻辑推演。每个环节之间都有上下文语境之间的关系。
本期节目聊到了:
1. 这期节目是怎么来的
2. 作为一种出版物的电子游戏
3. 游戏的消费方式
4. 早期只有资讯,没有社区的游戏
5. 关键问题,游戏如何演化成了⽣活的⼀部分?
6. 关键线索一:从买断制到持续运营
7. 关键线索二:更多的消费方式
8. UGC 基础设施的普及
9. 社会生活的底层逻辑
10. ⼀转眼,社区远⼤于游戏游玩
11. 到底什么是社区?
名词解释:
UGC:用户生成内容
相关链接:
汉洋关于小红书的文章《小红书的造梦都市》 (https://hanyang.wtf/p/354)
为了写文章弄的美妆号(不咋更新) (https://www.xiaohongshu.com/user/profile/644a7438000000001f0312f0?xhsshare=CopyLink&appuid=65bfaba6000000000903f49e&apptime=1726624320&share_id=231ddf88bdac4b15aecef0f32d1fb1be)
小红书账号:汉洋在拍照 (https://www.xiaohongshu.com/user/profile/65bfaba6000000000903f49e?xhsshare=CopyLink&appuid=65bfaba6000000000903f49e&apptime=1726625265&share_id=04f15a42775e458c8c7bda47454baa0f)
如何获得快乐:与重轻唠唠游戏产业的科普 (https://podcast.latepost.com/22)
按下快门,记录镜头下的沉玉谷绝美景色! (https://www.xiaohongshu.com/explore/66821155000000001e012fea?secondshare=weixin&share_from_user_hidden=true&appuid=&apptime=1722666916&xsec_source=h5_share&xsec_token=CB83gMGeBKxeviyPIQrwrwBRiHOzRN5ejO2wjn5hr5UOw%3D)
风男们跳magnetic😱🙌🏻!!! (https://www.xiaohongshu.com/explore/667d0335000000001f007774?app_platform=ios&app_version=8.47&share_from_user_hidden=true&xsec_source=app_share&type=video&xsec_token=CBuO6yQ1nh5slK8IeuAzSJ-DyaNuNr4Eau9qBJ5IcDK-I%3D&author_share=1&xhsshare=WeixinSession&shareRedId=ODYzNzg3NUs2NzUyOTgwNjY0OTdGSUxC&apptime=1722673228)
【原神无UI】无缝转场,极致丝滑 (https://www.xiaohongshu.com/explore/66a4c65d0000000027011bf0?app_platform=ios&app_version=8.47&share_from_user_hidden=true&xsec_source=app_share&type=video&xsec_token=CB2QQNbdrySDQdX_syMPu12gcrmGDCFB8-O0UchZ3FUtA%3D&author_share=1&xhsshare=WeixinSession&shareRedId=Nzw3N0g9SUw_TEc3QEA3PEo0Tz45SUdM&apptime=1722667076)
痛耳机:全网首个魈宝痛耳机 (https://www.xiaohongshu.com/explore/6621e90800000000010047f5?app_platform=ios&app_version=8.53&share_from_user_hidden=true&xsec_source=app_share&type=video&xsec_token=CBA-2IJzNrYTli4sVP_A0ywdxNufva-nbZq_7bRbMTyWA%3D&author_share=1&xhsshare=CopyLink&shareRedId=ODtERkRHRT82NzUyOTgwNjY8OTpKOT9O&apptime=1726673032)
自制散兵联名特饮:买不到?无所谓,姐教你自己做! (https://www.xiaohongshu.com/explore/668a2ead000000000a006036?app_platform=ios&app_version=8.47&share_from_user_hidden=true&xsec_source=app_share&type=video&xsec_token=CB5MU7x42rLyKdPVSF4MH5lbuPqsKu5c3wd24on4T3iR0%3D&author_share=1&xhsshare=WeixinSession&shareRedId=Nzw3N0g9SUw_TEc3QEA3PEo0Tz45SUdM&apptime=1722667476)
Has Genshin Impact Ruined Conventions? (https://www.youtube.com/watch?v=FmiilbXTv44)
恋与深空与猫 (https://www.xiaohongshu.com/explore/668e6b58000000002501597f?app_platform=ios&app_version=8.47&share_from_user_hidden=true&xsec_source=app_share&type=normal&xsec_token=CBAYg88TMa-xDDxMyJhntzu3d1Jdvza9RxQ5lZHtEr4j8%3D&author_share=1&xhsshare=WeixinSession&shareRedId=Nzw3N0g9SUw_TEc3QEA3PEo0Tz45SUdM&apptime=1722669406)
绝区零模仿小红书的桥段 (https://www.xiaohongshu.com/explore/668fa72e0000000025006088?app_platform=ios&app_version=8.47&share_from_user_hidden=true&xsec_source=app_share&type=normal&xsec_token=CB6Og1a04U9wLPSfabqqhhf3Jl9HRPo3nTdnuOZG9Jcl8%3D&author_share=1&xhsshare=WeixinSession&shareRedId=Nzw3N0g9SUw_TEc3QEA3PEo0Tz45SUdM&apptime=1722670845)
登场人物:
重轻:播客《不在场》主理人
汉洋:朋友你关注我小红书了吗?
后期:甜食
题图:汉洋的猫在看游戏
GPU 算力总消耗会提升,但暂时有冗余;AI 应用开发热情未冷却,只是不被 VC 关注。
今天的节目是一期加更,我们在 OpenAI 最新模型 o1 发布后的第二天,邀请了硅基流动创始人袁进辉与我们讨论了 o1 这一新进展,也分享了今年 1 月至今,袁进辉观察到的 AI 开发者社区的变化。
上次袁进辉做客《晚点聊》是今年 1 月,那时他刚开始新一次创业没多久,选择做服务 AI 开发者的推理(inference,即大模型的使用)加速和优化。
OpenAI o1 的一个重要新特性,正是从扩大 train-time compute 的规模到扩大 test-time compute(见下图,来自 OpenAI 官方博客),即通过在推理阶段分配更多计算资源提升模型效果——也有人称之为从 train scaling laws 到 inference scaling laws。
https://cdn.z.wiki/autoupload/20240916/1tKi/1280X794/1280X1280.PNG
英伟达 AI 科学家 Jim Fan 说,这可能是自 2022 年 DeepMind 提出 Chinchill Scaling Laws(原版 Scaling Laws 上的一个优化)以来,大模型研究中最重要的一张图。
总结而言,o1 打破了一个预期:过去在大语言模型范式下,模型在解决推理逻辑问题时遇到了瓶颈。而 o1 通过强化学习(Reinforcement Learing,也被简称为 RL)、思维链(chain of thought)和测试时间计算(test-time compute)显著提高了模型的逻辑推理能力,所以在科学、数学和编程等需要更多逻辑能力的任务上表现大幅提升。
这期播客里,袁进辉比较通俗地解释了强化学习、思维链,还有 test-time compute 是怎么发挥作用的。我们也讨论了 o1 的这些新技术特性对算力消耗量,行业应用还有其它 AI 公司的动作可能有什么影响。
节目后半部分,我们进一步讨论了 AI 开发者生态这一年的变化。与很多人的观点不同,袁进辉说,在应用开发端,他没有感到 AI 热潮的冷却,只是现在涌现出的很多开发者是小微企业甚至是个人开发者,他们不在传统 VC 的视野里。所以一方面,创投市场会觉得 AI 应用的爆发不如预期,另一方面,实际调用量也在快速增长。
他还分享了一些一手数据:比如硅基流动自己的客户,调用最多的开源模型,国外是 Meta 的 Llama,中国则有阿里巴巴的通义千问和幻方的 DeepSeek,千问的优势是不同规模的模型版本齐全,而 DeepSeek 则在编程能力上突出。
时间线传送:
·o1 的“Wow”在于突破了大模型方法下的推理能力瓶颈
02:56 o1 发布,兑现了之前已被逐步释放的高预期
03:57 模型三重能力:语言、常识、推理,前两者之前已做得比较好,o1 提升了第三点
05:25 “弱智吧”是大模型试金石?
06:35 同样使用强化学习,AlphaGeometry 关注度为何没有 o1 高?——强化学习本身不新了,Alpha 家族的 Wow 时刻已经发生,o1 的进展是打破了大语言模型推理弱的预期
10:28 o1 新方法:强化学习、思维链、test-time compute
11:06 强化学习和思维链,都是在解决数据问题
11:34 强化学习可以补充专业数据,它更适合规则清晰、反馈清晰的领域
16:50 思维链(chain of thought)是在补充抽象层次较高的宏观数据
23:09 强化学习和思维链可以正交,比如可以通过强化学习也生成一系诶思维链分步骤数据
25:07 列出思维链:最初是人写,现在可能是用规则,更优雅是靠模型
29:19 test-time compute,这不是直接补充数据缺陷,而是原本做一次的推理(inference)变成做 N 次,就像人的“深思琢磨”
31:18 强化学习、思维链、放更多资源给推理,每一个单独看都不是石破天惊的 idea,但 OpenAI 做了很好的组合
34:36 “2022 年以来大模型领域最重要的一张图”,揭示 inference scaling law
·总算力需求会提升,短期有冗余,o1 不改变训基础模型公司减少的趋势
36:49 o1 新范式意味着需要更多 GPU 吗?对英伟达的影响?
38:51 猜想,预训练和强化学习的具体结合方式
40:56 算力需求也和参数规模相关,推理核心本身的参数可能不会特别大
43:32 从 API 收费看,目前 o1 推理成本可能是 4o 的几十倍
47:05 o1 最适合用在哪儿?Agent 可能能跑通了
48:45 程序员是最适合的 Agent 吗?辅助程序员在 o1 前就在发生
50:13 脑洞:o1 这类模型继续发展,能解决黎曼猜想吗?
54:28 目前 o1 很慢,但有优化空间,一个技术应用的规律是:效果在早期更重要,之后缩短计算时间、降低计算成本几乎是确定性的
58:15 为什么目前 API 调用对速率有限制,且不支持一些功能?
01:00:14 当前可做的推理优化:并行部分思维链计算,减少不必要的思维链过程
01:04:20 新变化也让一些工作可能没必要了,比如复杂的 prompt 工程
01:06:06 o1 对中国的影响:总体不改变训基础模型的公司变少的趋势
01:10:48 去年至今,GPU 算力价格已在下降,训练需求减少,推理需求增长暂时不会弥补,短时间 GPU 有冗余
·AI 应用开发需求未冷却,只是更分散、更小微、个人化
01:13:13 供给端有调整,但在技术应用端,“我没有感到变冷”
01:15:13 更多个人开发者和小微企业做探索,更多其他行业来尝试,因为不需要完整 AI 班子了
01:18:33 应用未冷却和 VC 市场觉得应用没爆发不矛盾,因为对 VC 还太小
01:19:52 硅基流动推出云服务后增长很快。“如果每天和开发者打交道,不会觉得行业停滞或在变冷”
01:20:31 一些增长快的产品例子,捏他
01:21:38 云服务带来便捷的例子:Koji 十分钟写完 emoji AI 翻译器
01:24:20 继续坚定出海,目前硅流海外客户更多
01:26:32 硅流平台被调用最多的开源模型:通义、DeepSeek、Llama
01:27:39 “需求在这边时,谁都来帮你的忙”
01:29:27 硅流平台上的客户,每天调用数亿到 10 亿 token 的是有的
01:30:22 叶军分享的钉钉 AI 付费的启发:用户现在为小功能付费,而不是复杂大应用
01:32:46 从苹果手机可能是入口,到“巨头递减”
01:38:02 我们看到大模型的“瓦特蒸汽机”了吗?
相关链接:
本期播客文字整理版 (https://mp.weixin.qq.com/s/zHDgDFG85xu3kFcAwpJfwA)
袁进辉上次做客晚点聊:《58:光年之外联创再出发,与袁进辉聊 AI Infra 到底做什么?》 (https://www.xiaoyuzhoufm.com/episode/65b19c9bc2bedd4be809a48a)
硅基流动云平台 SiliconCloud
https://siliconflow.cn/zh-cn/siliconcloud
《OpenAI 再次给大模型 “泡沫” 续命》(《晚点 LatePost》关于 OpenAI o1 的文章) (https://mp.weixin.qq.com/s/0SZp-YX_NyLx8XqIEEyJLQ)
“蹭下热度谈谈 OpenAI 的价值”(播客中提到的中科院张俊林微博) (https://m.weibo.cn/status/5078239682499316?sourceType=weixin&from=10E9195010&wm=9856_0004&featurecode=newtitle&s_channel=5&s_trans=1064649941_5078239682499316&jumpfrom=weibocom)
登场人物:
袁进辉,硅基流动创始人。联系可加微信:SiliconFlow01
程曼祺,晚点科技报道负责人。即刻:程曼祺_火柴Q
贺乾明,晚点科技报道作者。即刻:我是 chiming
剪辑:甜食
经过去年的技术猛进,今年下半年,市场对 AI 的关注焦点逐渐变成大模型到底怎么落地,怎么创造价值?
在诸多大模型落地的潜在方向中,SaaS,即面向企业和专业工作者的软件服务被认为可能是最快、最确定的一个。
今天的嘉宾是有十年 AI SaaS 经验的科大讯飞副总裁王玮。她是语音技术研发出身,2015 年主导负责和开发了中国最早的 AI SaaS 产品“讯飞听见”,这是一款语音转写 SaaS。去年,讯飞又将旗下的讯飞听见、讯飞会议、讯飞同传、讯飞写作等办公产品整合为智能办公 SaaS 平台。
我们与王玮聊了过去一年大模型对讯飞的 SaaS 业务带来的冲击与机会,过去十年她做 AI SaaS 的经验和教训,以及更久之前,她作为语音技术研发人员的职业成长故事。
在讯飞成立的 1999 年,中国还没有成熟的风投、融资创业不是主流,这是一家第一天就要平衡赚钱生存与研发投入的公司。在现在的创新、创业环境下,这种平衡也是很多想做大模型的公司要面临的情形。讯飞听见的故事可能是一个参考。
时间线传送:
·大模型给 AI SaaS 带来的冲击与变化
02:34 去年讲技术节点,精确到几月几号;今年全行业重点变成讲落地
05:53 AIGC 的价值是把人从机械工作中解放出来
07:17 讯飞也在侧重消费者业务板块,但投放上不是烧钱拉新逻辑
13:21 一批新公司主打免费,讯飞为何继续收费?
14:28 语音转写的体验差异要看困难场景的表现:多语种混杂,多人对话
16:14 从方言保护到语音技术的演变:过去需要语言学家,现在是技术驱动,未来可能需要对语言重新深入了解
20:10 大模型本身不足以解决“鸡尾酒会场景”等语音难点,还要配合工程能力积累
20:57 讯飞也在探索端到端语音技术
·讯飞做 AI SaaS 的十年经验:软件+硬件+服务一起做
24:18 2010 年,讯飞第一次尝试消费者业务,做语音输入法
26:23 讯飞听见的诞生:语音输入法使用短语音技术,想做投入更大的长语音,需要一边研发,一边赚钱
26:48 AI 会带来失业吗?速记行业的“反讯飞联盟”的消失
29:11 讯飞听见一开始就同时做 to B 和 to C
30:07 to B 要适配国产操作系统,且要自己设计硬件工作站,方便企业私有化部署
32:50 产品经验:软件+硬件+服务
34:08 做 SaaS 一直要面临的抉择:更通用 or 更垂直(定制)?
36:43 具体场景案例:讯飞怎么做深会展场景?
41:25 为什么做 SaaS 也应该做硬件?
43:57 离线版的升级需要派人去做本地服务,需要做好交付团队和生态
46:05 AI SaaS 要追求 3 个成功:产品成功、市场成功、财务成功
·聊未来:出海与行业悬念
52:39 AI SaaS 出海数据法规最严的欧洲,合规经验
57:08 未来一年,AI SaaS 的行业悬念——会不会有新商业模式
本期人物:
王玮,科大讯飞副总裁、听见科技总经理
程曼祺,晚点科技报道负责人,即刻/小红书:曼祺_火柴Q
剪辑:甜食
东南亚,曾是许多中国投资人心中的“应许之地”。
2017 年前后,中国打车、团购大战告一段落,在“时光机理论”的指引下,投资人将数百亿美元投向打车与外卖平台 Grab、Gojek,电商平台 Lazada、Sea、Tokopedia等,他们希望在这里找到下一个阿里、美团或是滴滴。
然而,Grab 自 2020 年上市至今市值已跌去 76%、Gojek 与 Tokopedia 合并后的印尼最大科技公司 GoTo 自 2022 年至今市值已跌去 85%。
东南亚市场今天还有人投资吗?电商大战还在打吗? TikTok、Temu 这样效率更高、手段更狠的新对手,给 Shopee、Lazada这样的老玩家带来了怎样的冲击?
今天我们请来了非常熟悉东南亚电商市场情况的朋友,墨腾创投创始人李江玕,他既在东南亚一线做过业务,也做过东南亚本地投资,现在墨腾创投(https://mp.weixin.qq.com/s/3JgndVfD_P6qAqhrSjVz5g)会定期输出对东南亚市场的观察。
李江玕曾担任打车平台 Easy Taxi 和外卖平台 Foodpanda 的东南亚区域 CEO,这两个业务都由德国孵化器Rocket Inteternet 投资,它孵化的另一个更为大众所知的项目,是今天东南亚第三大电商平台 Lazada。
内容摘要:
10:22 老板太粗鲁,球赛输了......外国员工辞职的理由你想不到
11:57 东南亚不是铁板一块,而是多个风格文化各异的国家市场
24:04 Lazada 为什么东南亚没打过 Shopee?
32:00 Temu 的低价打法,在原本已经非常低价的东南亚市场,还会奏效吗?
38:13 美团外卖出海有多大机会?
44:33 东南亚电商第一名 Shopee 今天面临的挑战:新对手效率更高,更算法驱动
53:10 TikTok 收购 Tokopedia 后,整合得怎么样了?
01:02:18 TikTok 和 Temu,组织管理的明显分野
01:11:00 谁还在投资东南亚?投资什么?
登场人物:
李江玕:墨腾创投 CEO,长期扎根东南亚
陈晶,晚点 LatePost 记者,正在看出海(微信:tiema233)
剪辑:甜食
封面图:Lazada的街头快递员
扫描二维码,可关注《晚点 LatePost》:
https://0.z.wiki/autoupload/20240808/nlN5/1050X1164/%E6%99%9A%E7%82%B9%E4%BA%8C%E7%BB%B4%E7%A0%81.jpeg
本期节目,我们访谈了智能驾驶供应商 Momenta 的创始人曹旭东。
Momenta 是曹旭东第一次创业,他 8 年前成立这家公司时刚满 30 岁。这之前,曹旭东在清华学物理,后来获得直博机会,但他中途从清华退学,转而去微软亚研院做 AI 视觉研究;2014 年,他加入了刚成立的商汤,创业前,他是商汤的研发总监。
在 2020 年之前, Momenta 都谈不上耀眼,它好像从来没成为过智驾行业里的 AI 四小龙或大模型五虎般的存在。而在 2021 年,这家公司却在一年里融了 10 亿美元,它的大部分融资都发生在这一年。
背后的逻辑也简单:特斯拉在 2020 年大卖,仿佛一夕之间,量产高阶方案就被接受了,而 Momenta 一直在做这件事,过去没什么反响,如今有了客户,而且是最多客户——目前 Momenta 手里有最多的智能驾驶车型定点——包括上汽智己,这是 Momenta 的第一个大客户,还有后来的比亚迪、广汽等等,数量超过了华为。
所以现在智驾行业里有一个新组合,叫“地大华魔”,指地平线、大疆、华为 和 Momenta,它们被认为是智能驾驶供应商里的头部玩家。
现在这一批 AIGC 公司的故事有些像自动驾驶的昨天:极高的期待,大额的融资,优秀的人才,在短时间里汇聚到一起。而一批智驾公司的今天,则展现了一个黑科技领域发展 10 年后可能会是什么样子。
我们和曹旭东讨论了 2023 年以来智驾领域的诸多变化,以及 Momenta 的策略与选择。这个行业还有很多悬念:车企与智驾供应商应该如何分工?在端到端大模型的大方向下,怎么选择具体的技术路线?未来市场格局会有多集中?能容纳多少公司?活下来的公司会是什么形态?
这次访谈的文字版,之前已经发布在《晚点》的公众号上,可见 shownotes 里的链接。
时间线传送:
·FSD 半年进化了几十倍,智驾在买车决策里更重要了
03:10 一年半前最担忧的事是 L2+ 不能真的帮车企卖车
04:12 技术进步,华为问界的催化改变了局面
07:07 部分车企等不及自研,更积极用供应商
08:41 FSD 进中国为是好事,卷价值,而非卷价格
10:07 欧美客户试乘后的评价
12:01 智驾公司盈利的条件
12:46 如何衡量智驾供应商的位置?体验、客户质量、客户数量
13:57 三维度对比,华为 vs Momenta
·超越智驾摩尔定律,未来第一名会占 70% 市场份额
16:31 智驾摩尔定律:每两年硬件 BOM 成本降一半,软件性能提升 10 倍
17:42 产业链定位,为什么 Momenta 做 Tier 1(直接给车企供货的一级供应商),而非 Tier 2?
18:56 整车追求差异化,智驾则没有差异化,只有好与更好
20:10 垂直整合,原因与边界
21:54 价位下探,未来 15 万的车也会标配高阶智能驾驶
22:34 和高通合作则不仅为性价比,也为上油车、混动
23:41 同时和英伟达、高通合作,什么体验?
25:26 低水平竞争可能会在两年内结束
27:17 智驾出海的机会和挑战
·端到端不难,难的是做高端到端的下限
29:02 端到端大方向下可能有 10000 条路
30:17 Momenta 开发端到端:用神经网络做感知→用神经网络做决策(deep learning planning)→感知、决策合成一个大模型
32:07 2021 年底的重要选择,当年底交付的方案到底用模型方法还是用规则方法?
35:39 新方案如何让客户信任
38:36 做出端到端不难,提高下限难,这是个体系工作
40:49 如何提高持续做对技术判断的概率?——低成本短周期试错
44:23 “正确的大方向”举例:围绕交付建立高效体系
46:11 短期压力导致短期救火,导致团队崩溃,坚持主线产品不分叉很重要
·“做有杠杆的事”
51:11 多发钱、高人效
51:45 Momenta 如何从 400 人交一个车型到现在几个人交一个车型
53:40 公司现在最大的杠杆,产品能和技术
54:37 组织目前的杠杆:持续招到和晋升更好的人
58:16 把公司战略穿到身上
01:00 重要决策来自小会议,人数一个车上能坐下
01:02 成为最终头部的挑战,全球化
01:03 在六道口试乘无图端到端,车上聊天
相关链接:
对话 Momenta 曹旭东:超越智驾的摩尔定律
https://mp.weixin.qq.com/s/QAZvo8xNw8UyIotyer7rEw
本期人物:
曹旭东,没有驾照的智驾公司创始人
程曼祺,晚点科技报道负责人,即刻/小红书:曼祺_火柴Q
剪辑:甜食
附录:自动驾驶图示 & 播客中提到的一些术语
https://cdn.z.wiki/autoupload/20240808/xDyU/1080X870/640.webp
自动驾驶有感知(Perception)、规划与决策(Planning)和控制(Control)三个模块,靠感知 “看”,靠决策 “思考” 怎么开车,靠控制模块完成驾驶行为。
端到端技术现在一般指从感知到决策,整个过程用一个大模型实现。
而过去的智驾技术系统,尤其是决策模块会使用大量编程写就的规则,而不是用深度学习来做。
我们在播客中聊到,Momenta 做端到端的过程,是先用深度神经网络做了感知,这是 2021 年之前很多公司就能做到的事,接着是在 2022 年用深度学习做了决策,也就是反复提及的“deep learning planning”,之后在 2023 年把两个分段的模型合成了一个端到端模型。
扫描二维码,可关注《晚点 LatePost》:
https://0.z.wiki/autoupload/20240808/nlN5/1050X1164/%E6%99%9A%E7%82%B9%E4%BA%8C%E7%BB%B4%E7%A0%81.jpeg
https://cdn.z.wiki/autoupload/20240804/ZqwC/1930X1285/WechatIMG2124.jpg
谭熠在清华的实验室。
核聚变发电,理论上需要的燃料重量只有煤炭的 1/10000000,不会排放二氧化碳,也不会像现在的核裂变发电站那样,可能泄漏危害环境上百年的辐射物质,被视为终极能源。
全球的科学家们研究了 70 多年,都没有把它变成现实。今年 7 月,核聚变工业协会(FIA)发布报告称,有 5 家公司计划在 2030 年之前实现核聚变发电,还有 21 家定在 2035 年之前。
核聚变发展真到了这个地步吗?
这期节目,我们邀请到了核聚变领域的资深研究者和创业者谭熠。他说,核聚变领域也存在 “Scaling Laws”,这本身是一个物理概念:把核聚变装置的尺寸、磁场感应强度和磁场利用效率提高后,就能达到更好的效果。“资金投入多了很多,有很多激励机制高效、效率高的公司参与,会大幅加速这个过程。”
谭熠 2002 年就在清华大学攻读核聚变方向博士,毕业后留在清华继续研究核聚变,现在他是清华大学副教授、博士生导师,管着清华大学的核聚变装置。2021 年,他创办星环聚能,成为中国首批核聚变创业者。现在他们在西安建成了核聚变装置,并成功点亮了等离子体,验证了技术路线。
他们计划在 2027 年建成下一代核聚变装置,目标是让核聚变输出的能量是输入能量的 10 倍,到时候距离核聚变发电就更近了。谭熠说,按照他们的计划,普通人再过 10 年就能用上核聚变发的电。
https://cdn.z.wiki/autoupload/20240804/YrKw/622X368/3854602d-65fb-4eaa-b631-2ded318d562e.gif
动图:星环聚能运行第一代核聚变装置,点亮等离子体。图片来自星环聚能。
本期节目我们聊了:
核聚变行业现状&研究历史
01:55 - 我们不能用之前几十年核聚变的发展速度去判断后面核聚变的发展速度。
04:13 - 聚变成功肯定是一件收益无限的事情,但是怎么达到这个目标,其实大家并不清楚,还得饱和式支持。
05:48 - 核聚变原理早就清楚,但我们不可能去用原子弹去引爆氢弹实现核聚变,必须从根本上改变实现方式,从惯性约束变成磁约束。
12:21 - 核聚变永远 50 年在当时是对的。现在也许不到10 年,在新的这阶段也有可能是对的。
19:42 - 实现核聚变,现在大家唯一信得过的就是做实验。不同国家、不同团队在不同装置上做不同实验,得到数据,最后做拟合,然后得出规律。虽然说不清什么道理,但是大家认为这是可信的,这个过程就跟训练 AI 有点像。
实现可控核聚变的不同路线和难点
21:32-更重视工程而不是基础科学研究,是推进核聚变发电的现实情况,也是正确的路线。
25:35 -什么样的路线、装置能实现核聚变,在市场上有竞争力,现在还没有共识。
31:11- 星环聚能选择球形托卡马克,最直接的原因是有路径依赖,已经研究 20 多年,对好处坏处都比较清楚。
37:19- 从原理来看,托卡马克就是一个变压器,不适合长时间稳态运行,现在大家做了各种辅助设备,强制变成了这样,做得非常累,非常难。
从头做一家核聚变创业公司的经历
42:36 - 此前的创业经历,让自己学会怎么去更投资人介绍自己的技术,为创办核聚变公司打下基础。
53:32 - 希望 2027 年建成下一代核聚变装置,实现 Q 值大于 10。信心来自核聚变领域的定标律,也就是 Sacling Laws(这本身是一个物理名词)。
56:12- 下一代装置要花 10 多亿元人民币,寻找资金是每天都在做的事情。
57:25-未来的不确定是,目标与现实之前缺少数据支撑,Sacling Laws 在这个阶段是一片空白。
01:06:23-创业后感觉自己潜力得到释放。过去两年的成果可能比过去二十年都多。
01:07:44-核聚变没道理实现不了,他们计划十年后让普通人用上核聚变发的电。
01:09:15-希望投资人胆子大一些,敢投跟美国公司不一样的技术路线。
相关阅读:
中国首批核聚变创业者谭熠:它总在你绝望时又给你希望|TECH TUESDAY https://mp.weixin.qq.com/s/5kk5oOLQB3noHlNpiG1dVQ
可控核聚变:离风投更近、离现实多远……还不好说丨TECH TUESDAYhttps://mp.weixin.qq.com/s/J2GBVZqS4bvadJrKOcMYdA
本期节目中出现装置、公司等名词:
托卡马克:由苏联科学家发明的核聚变装置,主要原理是借助强大的磁场压缩高温等离子体,首先核聚变,是目前核聚变发电的主流方案,强场托卡马克、球形托卡马克都是衍生路线。
等离子体:固体、液体、气体之外的第四种粒子,有点像带电的高温气体,实现核聚变的基础粒子。
磁约束:用强大的磁场压缩高温(1亿°以上)等离子体到特定空间,实现核聚变的路线。
JET:世界上建成的最大的托卡马克装置,核聚变记录的创造者,去年底实现 5.2 秒核聚变后关闭。
ITER:正在建造的巨大托卡马克装置,有十层楼高,全球多个国家投资 200 多亿美元,预计明年建成,2035 年运行。
Helion、CFS:两家美国核聚变创业公司。
登场人物:
谭熠,星环聚能创始人、首席科学家。
贺乾明,晚点科技作者。即刻:我是 chiming
剪辑:甜食
*头图:Lody 被遣返后,拿到的装有自己手机、询问记录的黄色档案袋。
本期《晚点聊》,我们邀请了一位字节前员工,曾在 TikTok 做出海业务的 Lody 分享他的一次极端经历。
2023 年 3 月,只背着一个双肩包、带着少数换洗衣物和文件,Lody 从巴西飞往美国开团队会议,入境地点是得州休斯顿。这本是一次短期出差,却改变了他的职业生涯。
在休斯顿机场,Lody 被美国边检部门带到“小黑屋”,经过数小时盘问后,他被告知将遭驱逐出境、签证注销,5 年内不能再申请美签。这还没完,为了等到下一趟回国的飞机,Lody 又莫名其妙地去了一次美国监狱,总共折腾了 5 天才被顺利遣返。这也使 Lody 面临新的职业选择,他多年来的积累在出海领域,后来不得不转岗到国内业务。
Lody 的经历是一个小概率事件,但也是今天越来越多出海人可能面临的风险。中国驻美大使谢锋今年春天曾在一个活动上分享,现在每月都会有数十名中方赴美人员被拒绝入境,包括留学生和学者等,他们都持合法有效签证,没有犯罪纪录。
这期节目,我们回顾了 Lody 去年在休斯顿机场的经历和此事的后续处理。Lody 的故事可能会给现在很多需要出海的国人一些小参考。
这个故事本身也很精彩,“小黑屋”和监狱是一个小剧场,汇聚了一群形形色色之人,有走私被查的南美青年,来度蜜月的情侣,同样被遣返的台湾同胞……这也是多年来,Lody 难得的完全没用手机和电脑的 120 小时,他停下来想了更多。
时间线传送:
·因和一位科学家同名、同生日,被请小黑屋,十小时后被告知签证取消
01:18 休斯顿入境,被美国海关和边境保护局(CBP)带进小黑屋
03:10 被要求交手机和密码
04:12 盘问手机里的聊天信息,CBP 很了解中国社交 App
06:30 不妙的入境时机:前有气象起球,后有周受资听证会
07:44 “你肯定不是团员,因为你已经超过了 28 岁”
08:42 仿佛一场小型听证会,问问题的边检人员都感到问题离谱
09:34 10+小时后,被告知将遭遣返,5 年内不能再申请美签
09:53 被请进小黑屋的原因,原来是一位 “crazy scientist”与我同名、同生日
·危机升级,体验私人监狱三巨头
13:18 在小黑屋里,认识了很多“奇形怪状的人”
15:16 一对度蜜月的夫妇也被遣返,休斯顿机场容不下 P 人
15:43 被告知得去监狱做上飞机前的核酸,因为未入境人员不能去医院
17:03 本以为做完核酸就能走,被告知要在监狱里待两天
18:28 与十几个拉美难兄难弟排队等入监手续,差点没住上单人间
22:47 该监狱由监狱三巨头之一的 GEO 运营,市值超过 20 亿美元
24:38 监狱里的牙刷、牙膏、衣服都是 made in China
28:47 离开环形监狱,回到机场
29:20 回国,想升舱,想喝酒,都被空姐拒绝
·后续影响:转岗国内,也看到工作不是唯一
31:52 影响其他地区出境,再没出过国
32:46 公司请律师帮助申请签证撤销豁免,但尚未有进展
34:47 活水转岗国内业务,无法再做热门出海方向
35:25 一些复盘 tips:尽量选蓝州(支持民主党)入境,避开大选等敏感期
36:39 高风险人群可带新手机入境
37:32 遇到盘问,不能撒谎,但也不用什么都说
40:52 蜜月夫妇和台湾人的案例——给 CBP 官员放你入境的理由,而不是相反
43:48 个人收获:多关心自己的生活、精神状态;同时看到世界上人和人之间没那么大区别
44:44 准备退休做非盈利项目,让外国看到中国的“奇怪之处”,也知道这些奇怪可以被理解
相关链接:
入境美国被遣返,强权系统五日记录
https://mp.weixin.qq.com/s/kuXsVJzL8gZs_4Ypf3pdvQ
本期人物:
Lody,小红书 ID: 刘小眼
程曼祺,晚点科技报道负责人,即刻/小红书:曼祺_火柴Q
剪辑:甜食
汉洋和可达前一段在美国的锈带转了一圈。正好之后汉洋去湾区,就和硅谷 101 的泓君录制这期串台。在国内天天听人说因为美国去工业化导致工人失业,然后工人很愤怒选出了特朗普开启了贸易战,到底是这样吗?
本期节目我们聊到了:
【见闻】
03:43 锈带之旅:关于美国大选的刻板印象与反直觉认知
04:22 重新理解罗斯福新政:民主党的支持画像
11:05 三种不同衰退的命运:伯利恒钢铁厂、九号煤矿与阿特拉斯水泥厂
18:14 卡拉马祖火车站:从辉煌的物流中转中心到流浪汉中转站
21:13 美国废墟与城市的坍塌:当上世纪科技之光在匹兹堡郊外躺了 70 年
23:49 不被看见的 Hood 人群:工业离开后,难找到体面的工作
34:29 无解的逆全球化:俄亥俄州只修大疆的维修店
37:10 锈带的三类城市:正在衰落(巴尔的摩、日耳曼敦)、彻底衰落(嘉里)与复兴(伯利恒)
41:14 厕所判断安全性:为何超市堆两米高的货物不让人上厕所?
【历史】
44:24 日耳曼敦:随着宗教发展,靠手工业和地理位置兴起的工商业小镇
48:37 美国工业崛起:煤炭、石油与钢铁
51:55 去工业化:劳资冲突、技术落户、决策重大失误
56:38 大部分锈带工厂在关停的时候还在挣钱
58:00 「这些人真的存在」
相关图片:
https://s2.loli.net/2024/07/09/bIfexTNoZtC8yRX.jpg
伯利恒钢铁厂的告示牌,by 汉洋,2024/05/30
https://s2.loli.net/2024/07/09/Yyktne4lP8wRJW7.jpg
匹兹堡郊区草地上废弃的范德格拉夫加速器,by 汉洋,2024/06/03
相关内容:
可达、重轻、小白免和汉洋后续关于美国锈带的详细内容会发布在山有虎。 (https://shanyouhu.xyz/)
《火线》(The Wire):是一部美国电视连续剧,于2002年到2008年在HBO频道播放。该剧共五季,讲述了巴尔的摩市的社会、政治、教育、犯罪和媒体等多方面的问题。这里是节目中提到的重轻在机核网的《火线》导读系列。 (https://www.gcores.com/radios/162745)
罗斯福新政联盟(Roosevelt's New Deal Coalition):是富兰克林·D·罗斯福在20世纪30年代建立的广泛政治联盟,支持其新政政策以应对大萧条。该联盟包括工人阶级、农业社区、城市居民(移民、少数族裔和非裔美国人)、知识分子和自由派人士,以及传统的南部白人民主党支持者。尽管这些群体在某些社会议题上存在分歧,但他们共同受益于新政的社会福利、工人权利、公共工程和农业补贴项目,帮助罗斯福赢得了1932年和1936年的总统选举,对美国政治产生了深远影响。
“美国三书”:三联和雅理共同推出的《钢的城:美国锈带兴衰史》《寻路:穿越分裂的国度》《无地可依:后工业时代芝加哥的家庭与阶级》。作者们或聚焦美国传统工业地区的经济社会转型,或全景展示全美各地不同立场、身份、文化的人们对于矛盾的感知及彼此沟通,在描摹美国社会矛盾的诸多细节,剖析美国困境的历史轨迹与结构性影响因素的基础上,试图寻找疗愈美国病症的良方。
《Code of the Street: Decency, Violence, and the Moral Life of the Inner City》:是社会学家艾略特·利伯(Elijah Anderson)撰写的一部重要著作,探讨了美国城市内城社区中的道德和社会规范,揭示了街头文化中的不成文规则和行为准则。书中特别探讨了“街道守则”(Code of the Street)这一概念,描述了在贫困和社会排斥的环境中,人们如何通过表现出“尊严”和“尊重”来维护自己的身份和社会地位。同时,书中也深入分析了内城社区中的暴力问题,以及这种暴力与街道文化之间的关联。
登场人物:
泓君:硅谷 101 创始人 (https://sv101.fireside.fm/),播客主理人
可达:一宿二宿程,千山万山月
汉洋:我就是溜达,欢迎订阅我的 newsletter (https://hanyang.wtf/)
封面:克利夫兰郊外的西屋电气工厂遗址
制作
AMEI
音乐
Branches (I Won't Let You Go)-Jordan Frye
There Will Come Soft Rains-Katharine Petkovski
在中国红海竞争环境下,垂类电商曾被认为是一个悖论:相较于综合电商平台获客成本更高、供应链缺少优势时,难以保持低价,用户持续流失。聚美优品、蜜芽网、蘑菇街、寺库等最终的失败都是例子。
中国之外,垂类电商在别的市场有机会吗?泰国第一名的化妆品电商平台 Konvy 提供了一种答案。
创业第十年, Konvy 创始人黄清桂才拿到第一笔融资,此前十年他靠的是老同学投资、向银行借钱做生意,今年,他拿到了1100 万美元的 A+ 轮融资,投资方之一是阿里。
2012 年,北京中关村创业最热闹的时候,黄清桂也曾做过淘品牌,并做到了垂类第一,但这次创业让他负债百万,他决定要做更大的品类、更高毛利的生意,于是他回到了小时候上学待过的泰国,和 Lazada 几乎同时起步,在基本毫无电商基础设施的泰国,建起了一家年营收 6400 万美元的美妆电商平台,并开始走向线下开店。
本期播客中,黄清桂分享了他作为中国人在海外如何创业、管人、学泰语的经历,也分享了他作为最早一批出海东南亚的互联网创业者,在异国他乡踩过的坑,如果你正在关注东南亚创业机会,不妨进来听一听。
内容摘要:
02:15 2012年国内电商方兴未艾,热闹非凡的时候,为什么选择去泰国做电商?
10:32 我经历了中关村创业最热闹的时候,咖啡厅都不够用
24:14 缺电商基础设施,缺钱,我如何找到第一个百万投资
28:40 化妆品平台最难解决的问题之一,如何保证正品?
29:00 东南亚电商大战中,一家垂类电商平台如何存活、长大的?
48:00 在电商渠道占比只有 10-20%的泰国,如何做线下渠道?
59:17 在根本没人想卷的东南亚,如何帮助员工提效?
72:43 品牌如何做全球化策略?
登场人物:
黄清桂:Konvy 创始人,正在学泰语
陈晶,晚点 LatePost 作者,正在看出海(微信:tiema233)
剪辑:甜食
封面图:Konvy 在泰国线下开的店
生成式AI出现后,每一天我们都在见证更加逼真、丰富的内容出现,但我们往往忽略的是,承载这些内容的框子——手机、电脑等电子设备上的产品界面还和以前一样,设计师仍然需要堆十万个图层才能设计出一个界面,这背后是大量重复、低效的工作。AI今天已经可以创造出新内容的“酒”,怎么样让AI也能更高效地创造出装这些酒的“瓶子”?
我们请来了AI设计工具Motiff 的运营副总裁张昊然,他在项目前期访谈了上百位设计师,总结他们共同的痛苦,和团队一起设计了一个帮助设计师提效的AI工具。
本期节目我们聊到了:
为什么要做这款产品?选择一个看起来很小众的市场?
行业头部公司Figma已经做的很大,为什么Motiff 还有机会?
设计软件经历了怎样的迭代?微信团队是怎么做设计的?
设计师们都面临怎样的苦恼?Ai能够怎么样帮助设计师们解决这些问题?
从第一天就想好了一个全球化产品,在国内和国外卖产品方式有什么不同?
未来我们真的还需要设计师吗?AI能否取代设计师这个工种?
今天AI使用的渗透率远低于大家想象,为什么?
相关链接:
Motiff体验官网:
www.motiff.cn
登场人物:
张昊然:从教育产品经理到AI工具运营
陈晶:随时可能被替代的文字工作者
剪辑:甜食
封面:Motiff新加坡发布会现场
本期节目是「晚点 LatePost」上周发布的《对话香港大学马毅》的采访音频。(原文见 shownotes 末尾链接)。
马毅现在是港大计算机系主任和数据科学研究院院长。自 2000 年从加州伯克利大学博士毕业以来,马毅先后任职于伊利诺伊大学香槟分校(UIUC)、微软亚研院、上海科技大学、伯克利大学和香港大学。
在如今的 AI 领域,马毅是一位直言不讳的少数派。不少人相信用更多数据、更大算力做更大参数的模型,就可以实现通用人工智能,这就是大模型的 Scaling Laws,它被一些人视为“信仰”。
马毅则不相信这条路。他认为现在的深度学习网络本质上,都是在做压缩(compression):就是从图像、声音和语言等高维信号里,找到能表示数据间相关性和规律的低维结构。
GPT 表现出来的数学推理等能力,在马毅看来本质还是依靠记忆和统计,就像一个接受填鸭式教育的、高分低能的学生,它并不能学到因果推理、逻辑等能力。这离他定义的智能还有相当距离。他认为智能最本质的特征是:能纠正自己现存知识的不足,而且能增加新的知识。
由此,马毅也完全不买账 AI 威胁论,他认为,说现在的 AI 危险的人,“要么是无知,要么是别有目的”。
为解释深度学习网络到底在做什么,马毅团队最近几年的重点工作是,白盒大模型,也就是用数学来解释深度学习网络的压缩过程,以找到更高效的压缩方式。
他也希望以此来对抗黑盒带来的误解,因为“历史上,任何有用的黑盒都可能变成迷信和巫术”。他担心 AI 威胁论可能带来过度监管,导致垄断,遏制创新。
真理不一定掌握在少数人手中,但少数派和观点竞争的存在增加了发现真知的概率。
*访谈过程中涉及了一些论文、著作和术语,我们也标注在了 shownotes 里的附录部分。
时间线指引:
-现有主流路线的局限
02:49 工业界更关注现有方法提效,而白盒模型刚提出时的工程验证有限。
05:08 现在的大模型是通过经验找到了一些有效的方法,但它引起的量变不是真正的智能。
08:29 现有方法其实只模拟了记忆的局部功能,资源消耗大GPT 类模型仍“高分低能”。
13:26 当整个community 都认可一两件事,可能忽略掉其他可能更重要的事,曾经的深度学习就是一个例子。
15:45 如果你作为年轻人,相信只靠 Scaling Laws 就可以实现 AGI,你可以转行了。(这部分提及的文章是附录里的 wide eyes shut)
18:44 因为研究不要怕特立独行:当年在微软亚研院招何恺明等员工,都会让大家想:你做的哪些事别人做不了?
-智能的原则:简约与自洽;达到智能的可能路径:白盒、闭环、自主
21:19 2017 年回到伯克利后,开始梳理已有成果:现有深度网络都是在做“压缩”(compression)。
23:18 白盒大模型是给这个压缩过程找到数学解释。
24:52 科学史上的好想法总会被翻新。
26:11 知道了压缩到数学原理,能帮助找到更高效的压缩方式。
26:50 Everything should be made as simple as possible, but not any simpler.前半句对应简约,后半句对应自洽。
29:39 为什么智能会出现?——世界上有值得学、能学到的规律。
32:47 知识不等于智能,GPT-4 有更多知识,婴儿更智能。智能的本质特则会给你是能纠正现存知识的不足并增加新的知识。
37:13 达到智能,除了从黑盒到白盒,还有从开环到闭环,从人工到自主。
40:48 自主学习的含义之一是,人的学习是在大脑内部建模完成的,不需要真去对比外部物理信号,生物没有这个选项。
46:17 跨学科研究和借鉴神经科学帮助形成了上述想法。
-验证推演 & 白盒对黑盒的祛魅
48:41 ReduNet 是一个框架,但工程实现还不够;CRATE 做了工程优化。
55:32 历史上任何有用的黑盒都可能变成巫术。
57:03 有人说 AI 是原子弹,我们看很可笑。
57:33 政府应该监管技术的应用,而不是技术本身。
59:07 从去年开始,更迫切感到要让更多人知道现在的 AI 在作什么,AI 没这么可怕。
60:16 白盒更实际的作用:减少试错成本、GPU 成本。
-对智能历史的梳理
01:05:04 为何机器智能的结构会类似生物智能?——尚未看到更高效地方法。
01:07:13 从维纳的《控制论》开始,第一批研究智能的选择并没有区分机器与生物。
01:09:58 闭环系统的好处,解决“灾难性以往”问题。
01:13:13 对(人工)智能的研究并非始于1956年。
01:15:26 深度网络的两次危机都与缺乏数学解释有关,但现在可能不会再发生。
01:17:23 从生物学和神经科学中学习,猴子大脑机制与智能研究发现的相似性。
01:20:36 真正的智能应具备自主学习和自我纠错的能力。
-创业 & 教育
01:24:14 学校做验证,公司做放大,希望证明白盒路线的可行。
01:29:09 要么有量变,用白盒显著降低训练资源or提升训练效率;要么有质变,探索闭环、自主的可能性。
01:38:53 业界其他的非主流路线探索:LeCun 的 JEPA,李飞飞新创业等。
01:41:21 港大正在推动 AI literacy 课程,所有专业都学,AI 应成为通识教育的一部分。
01:48:39 达特茅斯会议为什么在智能前面加上 artificial?——也是追求和前辈不一样,想探索人类高级智能。
01:52:20 科学竞争最关键的就是人,重要的是把资源分配给正确的人。
相关链接:
对话香港大学马毅:“如果相信只靠 Scaling Laws 就能实现 AGI,你该改行了”
https://mp.weixin.qq.com/s/YTLWgcsGds86lgW_druXBQ
【视频】马毅教授谈神经网络,《简约和自洽》:神经网络从黑盒到白盒,学习模型从开环到闭环
(听完播客还有兴趣了解跟多的话,非常推荐这个视频,有图解、有现场,深入简出)
https://www.bilibili.com/video/BV1tN411F77Z/?vd_source=3ea9875872e1534f62079295c4e2c464
忆生科技Engram正在招募优秀人才,简历请投递:recruit@transcengram.com
访谈中提到的论文:
Scaling White-Box Transformers for Vision, 2024/5
https://arxiv.org/abs/2405.20299
Eyes wide shut? exploring the visual shortcomings of multimodal llms, 2024/4
https://arxiv.org/abs/2401.06209
White-Box Transformers via Sparse Rate Reduction: Compression Is All There Is? 2023/11
https://arxiv.org/abs/2311.13110
Unsupervised Learning of Structured Representations via Closed-Loop Transcription, 2022/10
https://arxiv.org/abs/2210.16782
本期人物:
马毅,香港大学计算机系主任
程曼祺,晚点 LatePost 科技报道编辑(微信:momochoqo;即刻:程曼祺_火柴Q)
剪辑:甜食
附录:访谈中提到的技术术语、概念和人物
维纳:在 1940 年代前后提出控制论。播客中提到的《控制论》的副标题是:under control and communication in animals and machine(“或关于在动物和机器中控制和通信的科学”)
香农:在 1940 年代前后提出信息论
Yann LeCun,图灵奖获得者、Meta 首席科学家
李飞飞,知名 AI 研究者,斯坦福大学教授
何恺明,知名 AI 研究者,ResNet 作者
1956 年达特茅斯会议:提出了人工智能(Artificial Intelligence)这一概念的会议
ReduNet,马毅团队 2022 年发布的白盒大模型理论框架
CRATE,马毅团队 2023 年提出的更新的白盒大模型
JEPA,Yann LeCun 团队提出的一种世界模型架构
封面:米可世界中东团队合影。
前不久,我接受米可世界的邀请和一些媒体朋友一起去了迪拜、沙特和埃及,了解中国企业的中东出海。
本期《晚点聊》就邀请到了米可世界的中东项目负责人 Emily。
2018 年,毕业复旦数学系、在上海工作的 Emily 48 小时内决定去中东创业,买了一张机票落地埃及后开始做语音社交产品,之后她又加入赤子城旗下的全球线上社交娱乐公司米可世界,负责语音社交产品 YoHo 等项目在中东的运营。
5、6 年里,米可世界的中东团队从一个会议室就能坐下的几十人发展成到了超 300 人,覆盖海湾、北非和部分南欧市场,运营着 MICO、YoHo、TopTop 和 Sugo 四个产品,过去一年收入超过 10 亿元人民币。
Emily 分享了很多中东创业的故事:最开始吃不惯阿拉伯食物,一天只吃一顿饭;沙特国庆时被也门大户写小作文指责,越来越了解中东各国间的微妙差别和对应的运营策略;在疫情时与同事一起应对行业危机。
Emily 在埃及的 6 年已经超过了 2000 天,可以开始听第三个一千零一夜了。这本古老的书暗合中东文化的一个特点:爱聊天,爱讲述。这是语音等各类社交产品在那里外受欢迎的原因。
绵延西亚、阿拉伯半岛和北非、有 4 亿人口的阿拉伯世是一个有众多国家和民族交错的复杂市场。不沉下来做本地化很难了解各中生存策略。Emily 的一手体验里就有在中东淘金的线索。
内容摘要:
·落地埃及:创业、加入米可,运营 YoHo
01:13 2018 年初打算投资中东的社交语音 App,后来自己创业,不到 48 小时决定来埃及。
03:30 2019 年加入米可,负责运营 YoHo,认定中东社交是大市场。
07:00 中东市场的优点:人口多,文化相似,当时的竞争相对少;难点:文化差异、互联网人才较少,细分度超出想象。
09:30 为何加入米可?——专注海外、重仓中东,中东市场需要很重的本地化。
13:01 什么团队配置适合出海:米可的组合是腾讯、微博(互联网)+华为、中兴(海外)
15:05 语音社交的产品形态?中东用户怎么用它?
17:23 在埃及理解了为何需要和陌生人聊天;生日收到平台用户 3000 美元的打赏。
19:45 国内和中东语音产品的区别:国内更偏内容,中东更偏社交。
25:04 王子飞机游艇轮番秀在中东也很罕见,但这里的一般工薪层更愿意花钱娱乐。
·深入本地化:细分市场的门道
27:29 中东“土豪”人没大家想象多,赚他们的钱也没那么容易。
28:30 中东多国间的差异化运营,沙特国庆时,被也门用户吐槽的故事。
30:15 TopTop 很长时间里的第一大户是巴林人,中东任何小国家都可能有大客户。
35:23 怎么看 TikTok 加码中东?
37:10 米可的多产品运营策略。
41:20 米可现在是多 App 的“灌木丛”策略,但同时在看大 App 的机会。
·出海建议
44:57 中东这两年热起来,热门中国电影也在考虑来中东。
47:11 出海落总部,阿联酋、沙特、埃及等怎么选?
48:40 用人之道:从招有更多经验的人变成招和培养年轻人。
52:08 没有在埃及职场观察到“躺平文学”
53:40 怎么在日常管理团队时融入本地文化。
54:40 通过更高质量的决策挺过 2020 年的政策危机。
62:43 对出海公司的建议:最重要的是选好当地负责人和合作伙伴。
64:49 中东本地 VC 不发达,在中东的初创中国企业尽量拿国内的钱,如 Yalla。
67:43 个人成长:真正体验了商业实操、管理实操,理解了“无所畏惧”。
74:46 对追求极致的数学解释。
相关链接:
海湾淘金:中国公司奔赴另一场招商引资
https://mp.weixin.qq.com/s/IK2JuQJSbNlbL-lr95-gHQ
(我问米可想贴什么链接让大家了解公司,他们很直接,上招聘链接:😀)
米可世界招聘官网
https://micoworld.jobs.feishu.cn/index
登场人物:
Emily,米可世界中东运营负责人,负责 YoHo 等产品
程曼祺,晚点 LatePost 科技报道编辑(微信:momochoqo;即刻:程曼祺 火柴Q)
剪辑:甜食
Comments
Top Podcasts
The Best New Comedy Podcast Right Now – June 2024The Best News Podcast Right Now – June 2024The Best New Business Podcast Right Now – June 2024The Best New Sports Podcast Right Now – June 2024The Best New True Crime Podcast Right Now – June 2024The Best New Joe Rogan Experience Podcast Right Now – June 20The Best New Dan Bongino Show Podcast Right Now – June 20The Best New Mark Levin Podcast – June 2024
United States