in ,

OpenAI發佈GPT-5啲圖錯曬  網民嘲諷:係咪用AI畫

OpenAI近日發佈新的GPT-5,當中少不了不停提到新GPT-5模型在各方面的表現評分。可是,有網民發現,當中的圖表比例似乎出現問題,例如在SWE Benchmark中,沒有Thinking的GPT-5表現分數為52.8,但卻高過旁邊的o3的69.1。而在顯示的另一個圖表Deception表現中,Coding Deception的GPT-5 Thinking版表現明明是50分,但卻低過旁邊o3的47.4。

OpenAI的Sam Altman其後承認是「mega chart screwup」,製作最後版本時過於匆忙,導致人為失誤。而OpenAI Marketing的職員在個人的X中,也有公開致歉。OpenAI其後在GPT-5的發佈文章中,確認圖表正確。

有網民嘲諷有關圖表是否用GPT-5畫,亦有網民認為如此專登,可能是OpenAI搏懵以為大家唔會細心睇,直覺以為GPT-5表現各方面都比舊版出色很多。

記者:阿鬼

天生火爆,用一團火和光合作用,繼續盡力發聲做記者。