Google於數小時前發布新一代圖像生成及編輯模型Nano Banana Pro(Gemini 3 Pro Image),新模型建基於Gemini 3 Pro。上一代Nano Banana只是幾個月前,今次咁快就有新版,引發不少人驚訝。
Nano Banana Pro在推理能力、文字顯示和創作控制三方面有顯著提升。模型可透過Gemini 3的推理能力,結合即時資訊製作資訊圖表和教學內容,並可連接Google Search取得天氣、食譜等實時數據,相當誇張。
文字顯示方面,新模型支援多種語言的文字生成和翻譯,可在圖像中正確顯示由短句至長段落的文字內容。系統能夠處理不同字體、紋理和書法風格,適合製作海報、模型圖和分鏡腳本。小編實際測試時,其生成文字的效果,明顯比現在的OpenAI Sora等都出色很多,可以生成更細緻和準確的效果。
創作控制功能讓用戶可同時混合最多14張圖像,並保持最多5個人物一致。用戶可進行局部編輯、調整相機角度、改變焦點和套用色彩分級,亦可轉換場景光線效果。系統支援多種大小,並提供2K及4K解像度輸出。
消費者可在Gemini應用程式選擇「Thinking」模型時使用圖像生成功能。免費用戶有用量限制,超過後會改用原版Nano Banana,而Google AI Plus、Pro及Ultra訂戶則享有較高配額。企業用戶方面,Google Ads的圖像生成功能將升級至Nano Banana Pro,Workspace客戶可在Google Slides和Vids中使用。開發者亦可透過Gemini API、Google AI Studio及Vertex AI使用新模型。
所有由Google工具生成的圖像均嵌入SynthID數碼水印。用戶現可在Gemini應用程式上傳圖像,查詢是否由Google AI生成。免費及Google AI Pro用戶生成的圖像會加入可見水印,Google AI Ultra訂戶及Google AI Studio開發工具則不會顯示水印。
