in ,

OpenAI發佈Sora 2影片生成包聲音  終於追得上Google Veo 3?

OpenAI最新發布的Sora 2影片生成模型,在逼真度上都有重大突破。今次Sora 2終於可以同時生成配套的音效、對白和環境聲音,終於追得上其他對手如Google Veo 3、Luma AI Dream Machine等等。ChatGPT Pro用戶可以使用進階版的Sora 2 Pro模型。

Sora 2在物理模擬方面有明顯進步,能夠準確呈現真實世界的物理定律。例如籃球投籃時,球會自然地從籃板反彈,而不是像舊版模型那樣出現瞬間轉移的情況。模型甚至可以處理複雜動作,包括奧運體操動作、滑浪板後空翻等高難度場景,並且正確模擬浮力和剛性的物理特性。

新模型加入了客串功能,用戶只需錄製一次短片和聲音,系統就能把用戶的樣貌和聲線放進任何生成場景中,主要配合新推出的Sora的iOS社交應用程式使用。用戶可以在Sora app平台上創作、重新混合他人的作品,以及透過個人化的內容推送發掘新影片。Sora app採用邀請制推出,目前先在美國和加拿大開放使用,之後會開放俾其他國家使用。在記者發佈會示範中,Sora app介面與TikTok抖音極度相似,似乎是想吸引年輕人使用,其所有內容都是由AI生成,影片逼真度似乎亦相當高。

OpenAI在客串功能上設有嚴格權限控制,用戶可以隨時撤回他人使用自己樣貌的權限。平台特別為青少年用戶設定每日觀看上限,家長亦可以透過ChatGPT管理子女的使用權限。OpenAI強調不會以增加使用時間為目標,反而希望鼓勵用戶多創作而非單純睇內容。

記者:機械人