Anthropic今日正式推出新一代AI模型Claude Opus 4.7,接替上代Opus 4.6。今次升級最受注目之處,是Claude在分數表中加入早前引發討論的Mythos模型,亦是首次配備自動偵測、並阻擋網絡攻擊用途的防護機制。而在網站介面上,用家亦首次有Adaptive Thinking選項,由模型自動決定是否需要諗清楚一啲,先提供答案。此外,在Claude Code中亦加入xhigh選項,與OpenAI ChatGPT 5.4類似,切合程式設計員寫程式碼時處理複雜情況的需要。
Anthropic上星期公佈Project Glasswing計劃,警告AI模型被用於攻擊的潛在威脅。公司表明會先在能力較低的模型測試新防護機制,然後才考慮推出更強的Claude Mythos Preview。Opus 4.7就是第一個加入相關機制的模型,訓練過程中刻意削減部分網絡攻擊相關能力,亦加入自動攔截高風險操作。
寫程式能力方面,Opus 4.7在多個開發工具公司的實測中表現明顯提升。程式碼審查平台CodeRabbit稱,今次模型揭發臭蟲的比率較Opus 4.6高逾一成。AI程式編輯工具Cursor指出,內部測試成績由58%升至70%,Factory旗下Droids提到,產品任務成功率提升10%至15%。Anthropic亦強調今次模型更懂得自我驗證。據數據服務公司Hex形容,Opus 4.7會在數據唔清楚時自行提出,而非老作捏造似是而非的內容。
視覺辨識能力亦有明顯進步。Opus 4.7可處理長邊達2,576像素(約375萬像素)的圖像,較舊版本提升逾三倍。自主滲透測試公司XBOW的視覺準確度測試,Opus 4.7取得98.5分,大幅拋離Opus 4.6的54.5分。對處理密集畫面的自動化AI助理(agent)、複雜圖表數據提取等應用有重大意義。
不過今次升級亦有陷阱,Anthropic提醒開發者需要重新校對舊有提示指令。由於Opus 4.7會嚴格按字面意思執行指示,過往為舊模型寫的提示詞可能產生意外結果。Anthropic解釋,之前的模型會「鬆散詮釋」指令,甚至跳過部分要求,但新模型會一字不漏跟隨。
收費方面,Opus 4.7維持與Opus 4.6一樣的定價,但用戶實際支出可能上升,由於Anthropic已更新tokenizer,同一段輸入可能會用多1至1.35倍的token數,加上新模型思考時間更長,輸出token亦會增加。他們於今天重設了訂閱月費用戶的用量,亦宣佈會加大用量額,配合Opus 4.7新需要。

