GPT-5.5拍得住未公開的Claude Mythos　　網絡安全攻防將變得更普及？

網上近日流傳OpenAI的GPT-5.5已追上Anthropic的Claude Mythos Preview，雖然有數據支持，但不能直接地說GPT-5.5已全面勝出。英國AI安全研究所（AI Security Institute，AISI）於日前4月30日公布網絡保安測試，GPT-5.5成為AISI第二個可由頭到尾完成企業網絡入侵模擬的AI模型。

有關測試名為The Last Ones，有32步驟，模仿企業網絡入侵。AISI估計，人類專家完成全程約需20小時。Claude Mythos Preview在10次嘗試中完成3次，是首個成功模型。GPT-5.5在10次嘗試中完成2次，排第二。

在範圍較細的網絡保安任務中，GPT-5.5同樣站在最前列。AISI用95項CTF形式測試模型，要求它在受控系統內找出保安漏洞並取回指定標記。在Expert級別任務，GPT-5.5平均成功率為71.4％，Mythos Preview為68.6％，GPT-5.4為52.4％，Opus 4.7為48.6％。AISI稱按這項數字，GPT-5.5可能是AISI測過最強的模型。不過，GPT-5.5亦未能完成另一個名為Cooling Tower的工控系統模擬，AISI稱現有測試未能判斷它是否能攻破防守完善的真實系統。這些數字仍有誤差範圍，報道指兩者更像同級競爭，未足以證明其中一邊明確拋離另一邊。

更重要的是，AISI反覆提醒，測試在受控的研究環境進行，一般用戶目前玩到的公開版GPT-5.5，未必能做到同樣效果。因為公開的版本仍有安全限制、監察和使用權限管制。而Claude Mythos Preview目前沒有正式發佈，因為其母公司Anthropic擔心太勁，所以只允許指定網絡安全公司或科技公司測試。

至於網上有人把Mythos風險說成Anthropic宣傳，AISI的兩篇測試不支持這個講法。Mythos確實是首個完成TLO的模型，也在Expert級CTF任務有73％成功率。GPT-5.5的數字顯示這類能力已不只限於一間AI公司的模型，重點唔係邊個宣傳較成功，而是網絡攻擊能力可能正在變成更普遍的趨勢。

AISI全名是AI Security Institute，即英國政府科學、創新及科技部轄下AI安全研究機構。它的工作包括在AI模型公開前後進行安全測試，評估模型會否協助網絡攻擊，以及現有安全限制能否阻止濫用。