Google Gemini Pro 模型全球上線,懂中文、日文等 40 種語言

Google昨日全球推出基於Gemini Pro的Bard聊天機器人,支援40多種語言,以及ImageFX圖片生成器,目前只支援英文。Google加強AI工具,包括MusicFX、TextFX等,在Google Labs專區測試。

Google 昨日擴大於全球推出以大型語言模型 (LLM) Gemini Pro 為基礎的 Bard 聊天機器人,可理解並翻譯中文、日語、法語、西語、德語、荷語等 40 餘種語言。

去年 12 月 Google 宣佈全新 LLM Gemini Ultra 及裝置版 Gemini Nano,Gemini Pro 則是通用性最強的 LLM,去年雖已成為 Google Bard 的底層模型,但只支援英文版。現在 Gemini Pro 將在全球 230 多國家地區上線。

Bard 去年推出時提供一個叫 Double Click 的功能,按下 Google Bard 的 G,可執行 Google Search 以比對 Bard 的搜尋結果,還能進一步檢視,避免用戶被 AI 幻覺的答案誤導。現在這功能也支援 40 多種語言。

同步推出 ImageFX 圖片產生器

除了一般性 LLM 的 Gemini Pro 外,Google 也公佈由 DeepMind 開發的文字轉圖片 AI 模型,不過目前只支援英文。 Imagen 2 類似 OpenAI 的 DALL-E 、 Meta 的 Imagine with Meta AI 或微軟 Designer 。它是以擴散式模型為基礎開發,能生成高品質、更逼真的圖像,像是手和人臉,還能去除圖片視覺偽影等問題。 Google 為 Image 2 加入 SynthID 數位浮水印,能嵌在像素中提供辨識 AI 生成圖,不過只能配合 Google 工具作用。 Google 也以護欄 (guardrail) 防止它生成暴力、色情或冒犯性的圖片,。

此外,Google 也公佈了新的 AI 圖像生成工具 ImageFX 。它和 Bard 一樣以 Imagen 2 為底層,此外,Google 也提供了名為 Expressive Chip 的功能,可建議一系列關鍵字,用戶可以用來測試並生成出想要的圖片。

最後,Google 強化了其他 AI 工具。首先,音樂生成工具 MusicFX 可生成長達 70 種的音樂,能成生反覆段落及利用 expressive chips 加以實驗。幫助文字工作者撰寫優美歌詞或文章的 TextFX,則強化了可使用性。 ImageFX 、 MusicFX 及 TextFX 可以在 Google Labs 專區測試。

來源:Techcruch

發表迴響

關於我們

自 1990 年創刊 UXmaster 雜誌,1991 年獲得美國 LAN Magazine 獨家授權中文版,2006 年獲得 CMP Network Computing 授權,2009 年合併 CMP Network Magazine 獨家授權中文版,2014 年轉型為《網路資訊》雜誌網站,為台灣中小企業協助技術領導者落實企業策略,了解網路規劃及應用,為企業網路應用、管理、 MIS 、 IT 人員必備之專業雜誌網站。


與我們聯絡

加入《網路資訊》雜誌社群

© Copyright 2025 本站版權所有,禁止任意轉載 網路資訊雜誌 / 心動傳媒股份有限公司 聯絡電話:+886 2 29432416

探索更多來自 網路資訊雜誌 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading

Secret Link