在一場長達兩個多小時的訪談中,AI 專家 Andrej Karpathy 深入探討了多個關鍵主題,涵蓋了強化學習的侷限性、自駕車的現實挑戰及 AGI 對經濟的潛在影響。Karpathy 指出,目前的強化學習方法存在顯著缺陷,認為需要新的監督方式來改善學習過程。他形容強化學習如同「透過吸管吸取監督信號」,這種方式可能會強化錯誤的推理路徑,導致學習效果不佳。相較之下,他提議的過程監督方法能夠針對推理過程中的每一步進行評分,從而精確強化正確步驟。
此外,Karpathy 也探討了大型語言模型(LLM)的認知缺陷,指出這些模型在處理創新代碼時的表現不佳,因為它們過度依賴訓練資料中的常見模式。他強調,真正的創新需要人類的思考過程,而不是僅僅依賴模型的記憶。
在談及 AGI 的未來時,Karpathy 表示,AGI 的發展將是漸進式的,並不會出現突發的智慧爆發。他認為,AI 對經濟的影響將是緩慢而持續的,最終可能融入 GDP 增長的 2%。這一觀點挑戰了許多對 AGI 迅速崛起的預期,提醒人們正確校準對未來的期待。