in ,

Claude Sonnet 4.5新模型發佈  成為全球最強寫程式模型

Anthropic推出全新Claude Sonnet 4.5,成為全球最強寫程式模型。這個版本在複雜架構、推理和數學能力方面都有顯著提升。Claude Sonnet 4.5在SWE-bench Verified評估中取得業界領先地位,能夠持續專注處理長達30小時的複雜多步驟任務,分數亦高達77.2%。在OSWorld基準測試中,新模型的電腦操作能力達到61.4%,較四個月前Claude Sonnet 4的42.2%有大幅進步。金融、法律、醫學及科學領域的專家都認為,新版本在專業知識和推理能力上明顯優於舊有型號。

Anthropic同時發布一系列產品更新。Claude Code加入了備受期待的檢查點功能,用戶可以儲存進度並即時回復到先前狀態,並推出原生VS Code擴充功能。Claude應用程式現在支援直接在對話中執行程式碼和建立文件,包括試算表、簡報和文檔。Claude for Chrome擴充功能亦開放給上月加入等候名單的Max用戶使用。開發者方面,Anthropic推出Claude Agent SDK,讓開發者可以使用支援Claude Code的相同基礎架構來建立自己的想要的程式。

在安全方面,Claude Sonnet 4.5被列入AI安全級別三(ASL-3),設有輸入與輸出內容的風險監察,以防範涉及化學、生物、放射及核相關的危險指令。Anthropic稱,經過改良後,誤判率已較早期大幅下降,相比五月推出的Claude Opus 4亦減少一半。

記者:機械人