in ,

Anthropic Institute稱AI正加速自主開發  或有可能完全失控

Anthropic旗下研究機構Anthropic Institute發表報告指出,人工智能正加速自主開發,旗下工程師在2026年第二季度正式寫入程式庫的程式碼量,已達2024年時的8倍。報告警告,AI能夠完全自主自我改良(recursive self-improvement)的時代可能比預期更快來臨,引發完全失控的安全風險,呼籲業界建立暫緩研發的全球合作機制,防範AI在不透明的競爭中失控。

各項性能測試數據均顯示AI的自主工作能力正加速提升,模型能獨立完成的任務時數已由以往每七個月增加一倍,縮短至大約每四個月便增加一倍。例如在2024年3月,Claude Opus 3只能完成人類需時約4分鐘的軟件任務,但一年後的Claude Sonnet 3.7已可應付需時1.5小時的工作,再過一年的Claude Opus 4.6更可處理長達12小時的任務。若此趨勢持續,AI在2026年內將可應付需時數天的工作,至2027年更有望處理需時數星期的任務。

Anthropic的內部數據亦反映了AI對開發工作的加速效應。截至2026年5月,該集團程式庫新增的程式碼中,有超過八成由Claude撰寫,遠高於2025年2月的水平。AI系統亦協助處理了許多以往因耗時而被擱置的繁瑣工作,例如在2026年4月,Claude提交了超過800項修正,將某類API錯誤率降至原本的千分之一。負責工程師估計,若由人類手動修正需耗時四年。

雖然AI在編寫程式碼和執行特定實驗上表現出色,但在選擇研究目標等需要研究眼光與判斷力的範疇,與人類仍有顯著差距。不過,Anthropic的測試發現該差距正迅速收窄。在2026年4月的一項AI安全研究中,由Claude運行的多個AI自主系統在僅有基本人類指導下,自主設計並完成了所有實驗,解決了近九成七的技術差距。

報告指出,AI未來的發展取決於技術趨勢會否持續。第一種可能是發展遇上瓶頸,例如晶片供應或電力容量限制令進程放緩。第二種可能是AI大幅提升效率,形成由AI自主系統協助運作的超高效率組織,但技術亦可能被用於大規模監控等情況。第三種可能則是AI完全實現自我改良,人類退居監督角色,失控風險則幾何級數增加。

記者:機械人