OpenAI發佈gpt-realtime　　進一步取代真人客戶服務等工作

OpenAI宣布推出gpt-realtime模型，目前只經API提供，讓程式開發者可以建立可靠的語音助手。今次最大突破，是能夠直接處理語音輸入和輸出，不用先轉成文字，大幅縮短對話等待時間。

這項新技術另一個厲害的地方是語音變化能力，系統可以在對話途中轉換語言，甚至聽得出用戶笑聲等表情，並按要求調節講話語調和口音。用戶可以要求系統用「友善的法國口音」或者「快速專業」的方式回應。在MultiChallenge語音測試中，GPT Realtime的準確度有30.5%，遠勝於過往去年12月的版本20.6%。

今次gpt-realtime能更準確選用合適工具，更支援同時進行多項工作，讓系統在等待其他工作完成時仍能繼續對話。這個語音介面現在支援遠端伺服器連接、圖片輸入功能，以及透過電話協定連接電話網絡，大大擴闊語音助手用途。

收費方面，OpenAI將GPT Realtime較之前測試版減價兩成。這項技術現已開放給所有開發者使用，並加入安全措施防止濫用，同時符合歐盟數據要求，預料會在客戶服務、教育及個人助理等範疇帶來重大改變。在發佈會中，OpenAI更與美國電訊商T-Mobile示範有關功能，展示有關AI助手就像真的客戶服務員一樣，協助用戶解決問題。