Google 昨日擴大於全球推出以大型語言模型 (LLM) Gemini Pro 為基礎的 Bard 聊天機器人,可理解並翻譯中文、日語、法語、西語、德語、荷語等 40 餘種語言。
去年 12 月 Google 宣佈全新 LLM Gemini Ultra 及裝置版 Gemini Nano,Gemini Pro 則是通用性最強的 LLM,去年雖已成為 Google Bard 的底層模型,但只支援英文版。現在 Gemini Pro 將在全球 230 多國家地區上線。
Bard 去年推出時提供一個叫 Double Click 的功能,按下 Google Bard 的 G,可執行 Google Search 以比對 Bard 的搜尋結果,還能進一步檢視,避免用戶被 AI 幻覺的答案誤導。現在這功能也支援 40 多種語言。
同步推出 ImageFX 圖片產生器
除了一般性 LLM 的 Gemini Pro 外,Google 也公佈由 DeepMind 開發的文字轉圖片 AI 模型,不過目前只支援英文。 Imagen 2 類似 OpenAI 的 DALL-E 、 Meta 的 Imagine with Meta AI 或微軟 Designer 。它是以擴散式模型為基礎開發,能生成高品質、更逼真的圖像,像是手和人臉,還能去除圖片視覺偽影等問題。 Google 為 Image 2 加入 SynthID 數位浮水印,能嵌在像素中提供辨識 AI 生成圖,不過只能配合 Google 工具作用。 Google 也以護欄 (guardrail) 防止它生成暴力、色情或冒犯性的圖片,。
此外,Google 也公佈了新的 AI 圖像生成工具 ImageFX 。它和 Bard 一樣以 Imagen 2 為底層,此外,Google 也提供了名為 Expressive Chip 的功能,可建議一系列關鍵字,用戶可以用來測試並生成出想要的圖片。
最後,Google 強化了其他 AI 工具。首先,音樂生成工具 MusicFX 可生成長達 70 種的音樂,能成生反覆段落及利用 expressive chips 加以實驗。幫助文字工作者撰寫優美歌詞或文章的 TextFX,則強化了可使用性。 ImageFX 、 MusicFX 及 TextFX 可以在 Google Labs 專區測試。
來源:Techcruch
