in ,

OpenAI發佈gpt-realtime  進一步取代真人客戶服務等工作

OpenAI宣布推出gpt-realtime模型,目前只經API提供,讓程式開發者可以建立可靠的語音助手。今次最大突破,是能夠直接處理語音輸入和輸出,不用先轉成文字,大幅縮短對話等待時間。

這項新技術另一個厲害的地方是語音變化能力,系統可以在對話途中轉換語言,甚至聽得出用戶笑聲等表情,並按要求調節講話語調和口音。用戶可以要求系統用「友善的法國口音」或者「快速專業」的方式回應。在MultiChallenge語音測試中,GPT Realtime的準確度有30.5%,遠勝於過往去年12月的版本20.6%。

今次gpt-realtime能更準確選用合適工具,更支援同時進行多項工作,讓系統在等待其他工作完成時仍能繼續對話。這個語音介面現在支援遠端伺服器連接、圖片輸入功能,以及透過電話協定連接電話網絡,大大擴闊語音助手用途。

收費方面,OpenAI將GPT Realtime較之前測試版減價兩成。這項技術現已開放給所有開發者使用,並加入安全措施防止濫用,同時符合歐盟數據要求,預料會在客戶服務、教育及個人助理等範疇帶來重大改變。在發佈會中,OpenAI更與美國電訊商T-Mobile示範有關功能,展示有關AI助手就像真的客戶服務員一樣,協助用戶解決問題。

記者:機械人