Google DeepMind今年在國際數學奧林匹克比賽(International Mathematical Olympiad,IMO)中創下歷史性成就,其最新版本的Gemini Deep Think推理模式成功解決六題中的五題,獲得35分總成績,達到金牌級別表現。這個增強推理系統能夠同時探索多個可能的解決方案,而不是採用單一的直線思考方式,並結合了平行思考等最新研究技術。
為了充分發揮Deep Think的推理能力,團隊使用新穎的強化學習技術來訓練Gemini,讓系統能夠運用更多的多步驟推理和定理證明數據。研究人員還為系統提供了精心策劃的高質素數學問題解答庫,並加入了解決IMO問題的通用提示和技巧。公司計劃將這個模型提供給數學家等可信測試人員,然後再向Google AI Ultra訂閱用戶推出。
Google DeepMind表示,這只是AI對數學貢獻潛力的開始。雖然今年的方法純粹基於自然語言處理,但該公司同時在形式化系統AlphaGeometry和AlphaProof方面繼續取得進展。研究人員相信,結合自然語言流暢度和嚴格推理的系統,將成為數學家、科學家和研究人員的寶貴工具,幫助人類在通向通用人工智能(AGI)的道路上推進知識發展。
國際數學奧林匹克組織已確認Google DeepMind提交的答案是完整且正確的解決方案。這次技術突破由Thang Luong領導整體技術方向,並得到多個技術專家的支持,包括Dawsen Hwang、Junehyuk Jung、Jonathan Lee等人的貢獻。
