OpenAI推出GPT-5.2迎對手　　實測後仍然令人失望

OpenAI正式發佈GPT-5.2系列模型，包括GPT-5.2 Instant、GPT-5.2 Thinking及GPT-5.2 Pro三個版本。官方宣稱，新模型在編寫程式、視像理解及長文處理等方面均有顯著改進。

編寫程式能力方面，GPT-5.2 Thinking在SWE-Bench Pro測試中達到55.6%的成績，創下新紀錄。這項測試評估真實軟件工程任務，包括四種編寫程式語言。早期測試者反映，新模型在前端開發及複雜使用者介面設計方面表現顯著改善，特別是牽涉3D元素的項目。不過，本站記者實測時，生成的程式碼仍然比對手Claude差很多，而且設計效果仍然比Claude Code弱很多，證明分數高未必代表一定好。

視像處理能力方面，GPT-5.2 Thinking在ScreenSpot-Pro測試中，模型達到86.3%的準確度，相比GPT-5.1 Thinking的64.2%有大幅提升。這項測試評估模型對圖形使用者介面截圖的理解能力，包括多種不同場景。而新模型在圖表推理及軟件介面理解上，錯誤率大幅減少約一半。模型能更準確解讀畫面上的元素，包括電路板、產品截圖、技術圖表及報告等，支援金融、營運、工程及設計等領域的工作流程。

GPT-5.2已開始向ChatGPT付費方案用戶（Plus、Pro、Go、Business、Enterprise）逐步推出。但價格方面，GPT-5.2定價為每百萬個輸入token為1.75美元，輸出token為14美元。相比GPT-5.1的每百萬個輸入1.25美元及輸出10美元，新模型價格略高。GPT-5.2 Pro定價為每百萬個輸入21美元，輸出168美元。

本站記者和不少網民實測過後，發覺實際使用上感覺不算太大，有程式設計員用來修復臭蟲，結果GPT-5.2仍然無法準確完成任務。小編亦試過用來解決一些寫程式碼問題，結果GPT-5.2仍然全錯。有用戶故意輸入錯字「Strawberrrry」，叫GPT-5.2去數有幾多個r，結果GPT-5.2真的數錯。