Google 推 ML Kit 新 API,手機端也能跑 Gemini Nano 生成式 AI

Google將推ML Kit新API,支援手機端Gemini Nano模型,讓Android App可離線執行摘要、改寫等生成式AI功能,提升隱私與開發效率。

Google 和其他科技大廠推出了很多 AI 技術和功能,但大部分都是跑在大型遠端伺服器端上。你的手機運算效能小得多,Google 也沒有忘記。在本周 Google I/O 大會上,Google 將宣佈最新 API,可讓 App 開發人員運用跑在手機上的 Gemini Nano 模型。

Android Authority 發現 Google 近日悄悄發佈了新版 ML Kit SDK 的文件,顯示將增加 Gemini Nano 的 API 支援。類似實驗中的 Edge AI SDK,其 SDK 是以 AI Core 開發,但加入一組預設功能可介接現有模型,簡化開發 App 的難度。

目前開發手機版生成式 AI 功能所遭遇的難題是,Google 提供的 AI Edge SDK 雖然可運用 NPU 來跑模型,但還只是實驗版,且只支援 Pixel 9,而且還只能處理文字。雖然支援的晶片商高通和聯發科都提供 API,但功能各廠牌不同,因此對 App 開發商來說,很難規劃開發專案,而且你必須要很懂生成式 AI 模型才能開發適用的 App 。有了新的 API,可大幅減輕開發商人員的作業負擔,也加快開發速度。

Google 說 ML Kit 的 GenAI API 可手機 App 就能做重點摘要、校訂文字、改寫文件或生成圖說,而不用將資料送上雲端。但 Gemini Gemini 運算能力不如雲端版,因此功能有限。例如,它只能做三點摘要,圖說也只限英文。輸出品質也要視手機上 Gemini Nano 而定。標準版的 Gemini Nano XS 大小約 100MB,而 Pixel 9a 上的 Nono XXS 大小僅 1/4,只支援約文字,context windows 也小得多。

ML Kit 不只支援 Pixel 手機,現在可跑 Nano 的還有 OnePlus 13 、 Samsung Galaxy S25 與小米 15 。未來如果支援的手機增加,Android App 開發商就能接觸到更多用戶。

手機上的 AI 優點是安全及隱私性。多數人不希望為了 AI 運算而把個人資料送到雲端。例如 Google Pixel Screenshots 功能會看到你所有螢幕擷圖,但只限於在手機端。 Motorola 手機也只會對 Razr Ultra 折疊式手機端的通知做摘要。但較低階的 Razr 卻會把資料送上雲端。因此支援 Gemini Nano 的 API 推出,能使手機端的 AI 使用經驗更一致化。

Google 預計在 I/O 大會上發表這項消息。 Google 已證實會有一場技術人員說明場次叫 Gemini Nano on Android:Building with on-device GenAI,預計介紹可「摘要、校訂和改寫文字,以及生成圖說」的 API,和媒體發現到的文件描述很類似。

來源:Ars Technica

發表迴響

關於我們

自 1990 年創刊 UXmaster 雜誌,1991 年獲得美國 LAN Magazine 獨家授權中文版,2006 年獲得 CMP Network Computing 授權,2009 年合併 CMP Network Magazine 獨家授權中文版,2014 年轉型為《網路資訊》雜誌網站,為台灣中小企業協助技術領導者落實企業策略,了解網路規劃及應用,為企業網路應用、管理、 MIS 、 IT 人員必備之專業雜誌網站。


與我們聯絡

加入《網路資訊》雜誌社群

© Copyright 2025 本站版權所有,禁止任意轉載 網路資訊雜誌 / 心動傳媒股份有限公司 聯絡電話:+886 2 29432416

探索更多來自 網路資訊雜誌 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading

Secret Link