Navigated to S2E22 AI 想越久越笨?最強推理模型 Gemini Deep Think 怎麼破解?

S2E22 AI 想越久越笨?最強推理模型 Gemini Deep Think 怎麼破解?

July 27
26 mins

View Transcript

Episode Description

AI 想越久越笨?Anthropic 最新研究震撼業界,模型越推理越跑偏,還自信滿滿腦補出一整段錯誤邏輯。

這不是 Bug,是一種全新的現象,名字叫做 Inverse Scaling in Test-Time Compute。

研究人員發現,在某些邏輯問題中,推理時間拉長反而讓模型表現變差,答案不只錯,還會越講越離譜。


這集我們就來聊聊:

📌 Anthropic 發現了什麼?哪些問題最容易讓模型越想越笨?

📌 為什麼推理時間拉長反而讓模型表現變差?

📌 我們該怎麼修?Tree-of-Thoughts、反思模組、平行推理各有什麼用?

📌 平行推理是不是解方?還是只是把廢話講成團?

📌 Gemini Deep Think 怎麼解題?為什麼它不會中招?


🎧 如果你對推理模型、模型幻覺、AI 訓練技巧、高階模型架構有興趣,這集你會聽得很過癮。

🔗 《矽谷輕鬆談》傳送門 ➡️ https://linktr.ee/jktech


(00:00) 開場

(01:12) 強推白天運動,真的有差!

(04:19) 五件事,讓你人生持續快樂

(07:12) Anthropic 最新研究:推理時間越長,模型反而越差?(08:49) 蘋果橘子陷阱題:你答得比 AI 還聰明嗎?

(10:29) 模型也會有「存在危機」?

(11:48) 為什麼 AI 越想越笨?

(14:09) 怎麼救?從 Prompt 到模型架構一次整理

(16:24) 平行推理是萬靈丹還是團體腦補?

(18:22) 可解釋性可以幫上什麼忙?

(19:43) 模型要重新分級了:高階推理模型登場

(20:24) Gemini Deep Think 最強模型拿下 IMO 金牌

(21:46) 從 2024 銀牌到 2025 金牌:Google 怎麼辦到的?

(24:18) 模型進步飛快,為什麼你用的還是一樣笨?


See all episodes

Never lose your place, on any device

Create a free account to sync, back up, and get personal recommendations.