OpenAI正式發佈GPT-5.2系列模型,包括GPT-5.2 Instant、GPT-5.2 Thinking及GPT-5.2 Pro三個版本。官方宣稱,新模型在編寫程式、視像理解及長文處理等方面均有顯著改進。
編寫程式能力方面,GPT-5.2 Thinking在SWE-Bench Pro測試中達到55.6%的成績,創下新紀錄。這項測試評估真實軟件工程任務,包括四種編寫程式語言。早期測試者反映,新模型在前端開發及複雜使用者介面設計方面表現顯著改善,特別是牽涉3D元素的項目。不過,本站記者實測時,生成的程式碼仍然比對手Claude差很多,而且設計效果仍然比Claude Code弱很多,證明分數高未必代表一定好。
視像處理能力方面,GPT-5.2 Thinking在ScreenSpot-Pro測試中,模型達到86.3%的準確度,相比GPT-5.1 Thinking的64.2%有大幅提升。這項測試評估模型對圖形使用者介面截圖的理解能力,包括多種不同場景。而新模型在圖表推理及軟件介面理解上,錯誤率大幅減少約一半。模型能更準確解讀畫面上的元素,包括電路板、產品截圖、技術圖表及報告等,支援金融、營運、工程及設計等領域的工作流程。
GPT-5.2已開始向ChatGPT付費方案用戶(Plus、Pro、Go、Business、Enterprise)逐步推出。但價格方面,GPT-5.2定價為每百萬個輸入token為1.75美元,輸出token為14美元。相比GPT-5.1的每百萬個輸入1.25美元及輸出10美元,新模型價格略高。GPT-5.2 Pro定價為每百萬個輸入21美元,輸出168美元。
本站記者和不少網民實測過後,發覺實際使用上感覺不算太大,有程式設計員用來修復臭蟲,結果GPT-5.2仍然無法準確完成任務。小編亦試過用來解決一些寫程式碼問題,結果GPT-5.2仍然全錯。有用戶故意輸入錯字「Strawberrrry」,叫GPT-5.2去數有幾多個r,結果GPT-5.2真的數錯。


