Kaggle 今日宣布與 Google DeepMind 合作,擴展其 Game Arena,推出新的基準測試,旨在評估實際代理能力所需的關鍵技能。此次更新包含幾個重要項目,首先是全新的狼人遊戲基準,這將測試參與者在社交推理和策略方面的能力。此外,還新增了撲克基準,專注於隨機性和策略的結合,以應對不確定性挑戰。AI 撲克對決的推出,則為 AI 系統提供了新的競技平台,促進其在撲克遊戲中的表現提升。最後,國際象棋排行榜的更新將進一步增強該領域的競爭性,讓參與者能夠追蹤和比較他們的進步。這些新基準的引入,將有助於推動 AI 在複雜情境下的表現,並為開發更強大的智能代理提供支持。