S2E22 AI 想越久越笨？最強推理模型 Gemini Deep Think 怎麼破解？

Update: 2025-07-27

Description

AI 想越久越笨？Anthropic 最新研究震撼業界，模型越推理越跑偏，還自信滿滿腦補出一整段錯誤邏輯。

這不是 Bug，是一種全新的現象，名字叫做 Inverse Scaling in Test-Time Compute。

研究人員發現，在某些邏輯問題中，推理時間拉長反而讓模型表現變差，答案不只錯，還會越講越離譜。

這集我們就來聊聊：

📌 Anthropic 發現了什麼？哪些問題最容易讓模型越想越笨？

📌 為什麼推理時間拉長反而讓模型表現變差？

📌 我們該怎麼修？Tree-of-Thoughts、反思模組、平行推理各有什麼用？

📌 平行推理是不是解方？還是只是把廢話講成團？

📌 Gemini Deep Think 怎麼解題？為什麼它不會中招？

🎧 如果你對推理模型、模型幻覺、AI 訓練技巧、高階模型架構有興趣，這集你會聽得很過癮。

🔗 《矽谷輕鬆談》傳送門 ➡️ https://linktr.ee/jktech

(00:00 ) 開場

(01:12 ) 強推白天運動，真的有差！

(04:19 ) 五件事，讓你人生持續快樂

(07:12 ) Anthropic 最新研究：推理時間越長，模型反而越差？(08:49 ) 蘋果橘子陷阱題：你答得比 AI 還聰明嗎？

(10:29 ) 模型也會有「存在危機」？

(11:48 ) 為什麼 AI 越想越笨？

(14:09 ) 怎麼救？從 Prompt 到模型架構一次整理

(16:24 ) 平行推理是萬靈丹還是團體腦補？

(18:22 ) 可解釋性可以幫上什麼忙？

(19:43 ) 模型要重新分級了：高階推理模型登場

(20:24 ) Gemini Deep Think 最強模型拿下 IMO 金牌

(21:46 ) 從 2024 銀牌到 2025 金牌：Google 怎麼辦到的？

(24:18 ) 模型進步飛快，為什麼你用的還是一樣笨？

Comments

In Channel

S2E39 生產力暴增，智力卻歸零？AI 時代人類的真正價值

2025-11-2324:32

S2E38 GPU 永動機：AI 生態系的玩家、金流與正被吹大的泡泡

2025-11-1616:13

S2E37 AI 的「小」革命：小型語言模型才是未來？

2025-11-0918:30

S2E36 常態裁員時代最佳生存指南：別忘了你有選擇

2025-11-0226:12

S2E35 AWS 大當機內幕：Race Condition 拖垮全球網路

2025-10-2725:48

S2E34 Threads 演算法為什麼有毒？看完直接免疫！

2025-10-1926:39

S2E33 我們真的需要社群媒體嗎？看完這集立馬刪掉上癮的 App

2025-10-1223:53

S2E32 穩定幣戰國時代開打：USDT/USDC 王座不保？

2025-10-0522:47

S2E31 Meta AI 眼鏡來了：史上最接近手機替代品？

2025-09-2828:51

S2E30 失控的 AI：你也有 AI 妄想症嗎？

2025-09-2124:36

S2E29 AI 瀏覽器大戰開打：什麼功能才能讓你放棄 Chrome？

2025-09-1422:37

S2E28 AI 軍火新創 Anduril：台灣面對中國戰爭的秘密武器？

2025-09-0725:35

S2E27 上億美金留不住人？Meta AI 大危機

2025-08-3128:08

S2E26 AI 時代 LeetCode 還重要嗎？

2025-08-2428:35

S2E25 十萬訂閱就裸辭！矽谷工程師的瘋狂職涯實驗

2025-08-1715:29