in ,

GPT-5.5拍得住未公開的Claude Mythos  網絡安全攻防將變得更普及?

網上近日流傳OpenAI的GPT-5.5已追上Anthropic的Claude Mythos Preview,雖然有數據支持,但不能直接地說GPT-5.5已全面勝出。英國AI安全研究所(AI Security Institute,AISI)於日前4月30日公布網絡保安測試,GPT-5.5成為AISI第二個可由頭到尾完成企業網絡入侵模擬的AI模型。

有關測試名為The Last Ones,有32步驟,模仿企業網絡入侵。AISI估計,人類專家完成全程約需20小時。Claude Mythos Preview在10次嘗試中完成3次,是首個成功模型。GPT-5.5在10次嘗試中完成2次,排第二。

在範圍較細的網絡保安任務中,GPT-5.5同樣站在最前列。AISI用95項CTF形式測試模型,要求它在受控系統內找出保安漏洞並取回指定標記。在Expert級別任務,GPT-5.5平均成功率為71.4%,Mythos Preview為68.6%,GPT-5.4為52.4%,Opus 4.7為48.6%。AISI稱按這項數字,GPT-5.5可能是AISI測過最強的模型。不過,GPT-5.5亦未能完成另一個名為Cooling Tower的工控系統模擬,AISI稱現有測試未能判斷它是否能攻破防守完善的真實系統。這些數字仍有誤差範圍,報道指兩者更像同級競爭,未足以證明其中一邊明確拋離另一邊。

更重要的是,AISI反覆提醒,測試在受控的研究環境進行,一般用戶目前玩到的公開版GPT-5.5,未必能做到同樣效果。因為公開的版本仍有安全限制、監察和使用權限管制。而Claude Mythos Preview目前沒有正式發佈,因為其母公司Anthropic擔心太勁,所以只允許指定網絡安全公司或科技公司測試。

至於網上有人把Mythos風險說成Anthropic宣傳,AISI的兩篇測試不支持這個講法。Mythos確實是首個完成TLO的模型,也在Expert級CTF任務有73%成功率。GPT-5.5的數字顯示這類能力已不只限於一間AI公司的模型,重點唔係邊個宣傳較成功,而是網絡攻擊能力可能正在變成更普遍的趨勢。

AISI全名是AI Security Institute,即英國政府科學、創新及科技部轄下AI安全研究機構。它的工作包括在AI模型公開前後進行安全測試,評估模型會否協助網絡攻擊,以及現有安全限制能否阻止濫用。

記者:阿鬼

天生火爆,用一團火和光合作用,繼續盡力發聲做記者。