Discover矽谷輕鬆談 Just Kidding TechS2E20 最聰明 AI 誕生:Grok 4 靠巨量 RL 打爆人類最終測驗
S2E20 最聰明 AI 誕生:Grok 4 靠巨量 RL 打爆人類最終測驗

S2E20 最聰明 AI 誕生:Grok 4 靠巨量 RL 打爆人類最終測驗

Update: 2025-07-13
Share

Description

全球最聰明的 AI 誕生了,而且它不是 GPT。

xAI 推出的 Grok 4,在最新的 AI 大魔王考試裡,不只全場最高分,甚至學會了怎麼自己叫工具、自己算數學、還自己訂貨賣東西,靠經營虛擬販賣機賺了 4694 美金,撐了 324 天不崩潰。

它的祕密武器叫做——巨量強化學習。


這集我們就來聊聊:

📌 Grok 4 的架構到底哪裡跟別人不一樣?

📌 強化學習不是拿來下圍棋的嗎?怎麼變成新的 pretraining?

📌 人類最終測驗是什麼?為什麼它比你所有面試都難一百倍?

📌 Vending-Bench 是什麼鬼?為什麼可以逼瘋大模型?

📌 Grok Heavy 值不值得每月 300 美金?

📌 如果每個 AI 都能考滿分,下一步是什麼?


🎧 喜歡最前線的 AI 訓練技術、尖端模型設計與超酷 benchmark,這集你一定會聽得超過癮。

🔗 《矽谷輕鬆談》傳送門 ➡️ https://linktr.ee/jktech


(00:00 ) 開頭

(00:58 ) 說走就走的旅行來去 Minneapolis

(04:35 ) 愛情來得太快就像龍捲風

(08:21 ) Grok 4 登場拿下最聰明 AI 寶座

(10:30 ) 人類最終測驗到底有多難?

(12:47 ) 為什麼 Benchmark 越來越不重要?

(14:12 ) Grok 4 vs Heavy 版到底差在哪?

(15:51 ) 巨量強化學習:訓練方式的大突破

(19:04 ) RL 是新的預訓練?效果到底有多猛?

(20:48 ) Grok 的語音模型:生動、即時、很會演

(22:02 ) ARC-AGI 測驗:人類秒解,AI 煩死

(23:45 ) Grok 經營虛擬販賣機 324 天賺爆

(26:03 ) Grok 的強項與罩門:推理很強,但日常還是 GPT?

(27:34 ) 我對 AI 的未來想像:內容自動化個人化 + 科學突破


Comments 
In Channel
loading
00:00
00:00
x

0.5x

0.8x

1.0x

1.25x

1.5x

2.0x

3.0x

Sleep Timer

Off

End of Episode

5 Minutes

10 Minutes

15 Minutes

30 Minutes

45 Minutes

60 Minutes

120 Minutes

S2E20 最聰明 AI 誕生:Grok 4 靠巨量 RL 打爆人類最終測驗

S2E20 最聰明 AI 誕生:Grok 4 靠巨量 RL 打爆人類最終測驗

柯柯與肯吉在矽谷