Google 於 2 月 26 日正式發表新一代 AI 繪圖模型 Nano Banana 2(正式名稱為 Gemini 3.1 Flash Image),整合了 Nano Banana Pro 的進階智慧與 Gemini Flash 的高速運算能力,並同步向免費用戶開放,大幅降低 AI 圖像產生的使用門檻。
本文目錄
從爆紅到進化:Nano Banana 的演進之路
Nano Banana 自 2025 年 8 月首度亮相後,以逼真的影像產生與靈活的編輯功能迅速走紅,在 AI 圖像工具市場中正式挑戰 Midjourney 和 OpenAI 等競爭者。同年 11 月,Google 再推出 Nano Banana Pro 版本,強化文字產生與工作室級創作控制。如今,Nano Banana 2 將兩者的優勢融合為一,讓所有使用者都能享有過去僅限付費訂閱者使用的進階功能。
具備即時知識的圖像產生引擎
Nano Banana 2 最大的突破在於導入 Gemini 3 的即時世界知識庫。模型能夠透過即時資訊與網路搜尋圖片,更準確地呈現特定主題,減少 AI 幻覺的發生。 Google DeepMind 產品經理 Naina Raisinghani 表示,這項能力讓使用者可以輕鬆製作資訊圖表、將筆記轉換為圖解,或產生資料視覺化內容。
此外,Nano Banana 2 在繪製文字方面也有顯著進步,能夠在產生的圖像中呈現清晰、可讀的文字,適用於行銷素材或賀卡設計等場景,甚至可以直接在圖像中翻譯與在地化文字。
創作控制能力全面升級
在創作控制方面,Nano Banana 2 帶來了多項改進:
- 角色一致性:在單一工作流程中可維持最多 5 個角色的外觀一致性,以及最多 14 個物件的視覺保真度,讓使用者能製作分鏡腳本或敘事連續圖。
- 精準指令遵循:模型能更嚴格地執行複雜的圖像產生請求,捕捉創作者構想中的細微差異。
- 支援多種輸出規格:從 512px 到 4K 解析度,涵蓋各種長寬比,無論是直式社群貼文或寬螢幕背景都能對應。
- 視覺品質提升:光影更生動、材質紋理更豐富、細節更銳利,同時維持 Flash 等級的產生速度。
部署範圍涵蓋多項 Google 產品
Nano Banana 2 即日起在多項 Google 產品中上線,包括:
- Gemini 應用程式:Nano Banana 2 將取代原有的 Nano Banana,成為 Fast 、 Thinking 及 Pro 模式的預設圖像模型。 Google AI Pro 和 Ultra 訂閱用戶仍可透過圖片選單中的「重新產生」選項使用 Nano Banana Pro 。
- Google 搜尋:透過 AI Mode 和 Lens 功能提供,新增 141 個國家與地區以及 8 種語言支援。
- AI Studio 與 Gemini API:以預覽版形式開放,同時也可在 Google Antigravity 中使用。
- Google Cloud:透過 Vertex AI 中的 Gemini API 以預覽版提供。
- Flow:成為 Google AI 影片工具 Flow 的預設圖像產生模型,所有使用者可免費使用。
- Google Ads:為廣告主在建立廣告活動時提供圖像建議。
AI 產生內容的辨識機制
隨著 AI 產生媒體的快速發展,辨識 AI 產出內容的需求也日益迫切。 Google 持續強化其 SynthID 浮水印技術,並結合 C2PA Content Credentials 標準,為使用者提供更全面的 AI 內容溯源資訊。
根據 Google 的資料,自 2025 年 11 月推出 SynthID 驗證功能以來,Gemini 應用程式中的驗證次數已超過 2,000 萬次。使用者可將圖片上傳至 Gemini 進行驗證,但目前僅限辨識由 Google AI 產生的內容。 Google 也預告將在 Gemini 應用程式中加入 C2PA 驗證功能。
不過,CNET 也指出,隨著 AI 圖像產生技術愈趨逼真,低品質的 AI 產生內容(俗稱 AI slop)已大量湧入社群媒體。調查顯示,絕大多數社群媒體使用者認為自己曾看過 AI 產生的貼文,但僅有 44% 的人有信心辨別。如何在推動技術進步的同時有效管理 AI 產生內容的影響,仍是產業需要面對的課題。
