Claude Sonnet 4.5新模型發佈　　成為全球最強寫程式模型

Anthropic推出全新Claude Sonnet 4.5，成為全球最強寫程式模型。這個版本在複雜架構、推理和數學能力方面都有顯著提升。Claude Sonnet 4.5在SWE-bench Verified評估中取得業界領先地位，能夠持續專注處理長達30小時的複雜多步驟任務，分數亦高達77.2%。在OSWorld基準測試中，新模型的電腦操作能力達到61.4%，較四個月前Claude Sonnet 4的42.2%有大幅進步。金融、法律、醫學及科學領域的專家都認為，新版本在專業知識和推理能力上明顯優於舊有型號。

Anthropic同時發布一系列產品更新。Claude Code加入了備受期待的檢查點功能，用戶可以儲存進度並即時回復到先前狀態，並推出原生VS Code擴充功能。Claude應用程式現在支援直接在對話中執行程式碼和建立文件，包括試算表、簡報和文檔。Claude for Chrome擴充功能亦開放給上月加入等候名單的Max用戶使用。開發者方面，Anthropic推出Claude Agent SDK，讓開發者可以使用支援Claude Code的相同基礎架構來建立自己的想要的程式。

在安全方面，Claude Sonnet 4.5被列入AI安全級別三（ASL-3），設有輸入與輸出內容的風險監察，以防範涉及化學、生物、放射及核相關的危險指令。Anthropic稱，經過改良後，誤判率已較早期大幅下降，相比五月推出的Claude Opus 4亦減少一半。