Google DeepMind 推出 Gemma 2 2B 小模型 積分測試超過所有 GPT 3.5 版本

Google DeepMind宣佈Gemma 2小語言模型,並推出確保安全性和透明度的工具。

Google DeepMind 上周宣佈小語言模型 Gemma 2 模型的 20 億參數 (20B) 版本,並提供確保安全性和透明度的工具。

Google DeepMind 在今年 2 月首先公佈以 Gemini 為基礎縮減的輕量文字對文字 (text-to-text) 模型 Gemma,並在 6 月公佈 Gemma 2 9B 和 27B 版本。全新的 2B 模型是透過蒸餾 (distillation) 向大型版本學習並產生更好的回應品質。 DeepMind 說,Gemma 2 2B 在 LMSYS Chatbot Arena 測試積分榜成績超過所有 GPT-3.5 版本。

Gemma 2 2B 利用 Vertex AI 和 Google Kubernetes Engine (GKE),可在多種硬體上,從筆電、邊緣裝置到雲端環境。它甚至小到可以執行在 Nvidia T4 深度學習加速器上。

ShieldGemma 和 Gemma Scope

DeepMind 另外宣佈兩個 Gemma 新成員:ShieldGemma 和 Gemma Scope 。

ShieldGemma 是一系列安全分類器,旨在偵測和仲裁 AI 輸出、輸入中的有害內容。 ShieldGemma 有多種規模,可偵測仇恨、騷擾、性暴露和危險內容。

GemmaScope 則著重透明度。這工具包含一組稀疏自主編碼器 (sparse autoencoder, SAE),是專門化的神經網路,可解析 Gemma 2 複雜的內在結構,以簡單易懂的格式說明資訊處理過程,輔助決策。

這工具提供超過 400 項免費的 SAE 涵括 Gemma 2 2B 和 9B 各層,目的在協助研究人員建立透明而穩定的 AI 系統。

研究和開發人員現在可從多個地方下載 Gemma 2 2B,包括 KaggleHugging FaceVertex AI Model Garden,也可在 Google AI Studio 試用。 ShieldGemma Gemma Scope 則可在 Hugging Face 取得。

來源:The Next Web

發表迴響

關於我們

自 1990 年創刊 UXmaster 雜誌,1991 年獲得美國 LAN Magazine 獨家授權中文版,2006 年獲得 CMP Network Computing 授權,2009 年合併 CMP Network Magazine 獨家授權中文版,2014 年轉型為《網路資訊》雜誌網站,為台灣中小企業協助技術領導者落實企業策略,了解網路規劃及應用,為企業網路應用、管理、 MIS 、 IT 人員必備之專業雜誌網站。


與我們聯絡

加入《網路資訊》雜誌社群

© Copyright 2025 本站版權所有,禁止任意轉載 網路資訊雜誌 / 心動傳媒股份有限公司 聯絡電話:+886 2 29432416

探索更多來自 網路資訊雜誌 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading

Secret Link