Google DeepMind 上周宣佈小語言模型 Gemma 2 模型的 20 億參數 (20B) 版本,並提供確保安全性和透明度的工具。
Google DeepMind 在今年 2 月首先公佈以 Gemini 為基礎縮減的輕量文字對文字 (text-to-text) 模型 Gemma,並在 6 月公佈 Gemma 2 9B 和 27B 版本。全新的 2B 模型是透過蒸餾 (distillation) 向大型版本學習並產生更好的回應品質。 DeepMind 說,Gemma 2 2B 在 LMSYS Chatbot Arena 測試積分榜成績超過所有 GPT-3.5 版本。
Gemma 2 2B 利用 Vertex AI 和 Google Kubernetes Engine (GKE),可在多種硬體上,從筆電、邊緣裝置到雲端環境。它甚至小到可以執行在 Nvidia T4 深度學習加速器上。
ShieldGemma 和 Gemma Scope
DeepMind 另外宣佈兩個 Gemma 新成員:ShieldGemma 和 Gemma Scope 。
ShieldGemma 是一系列安全分類器,旨在偵測和仲裁 AI 輸出、輸入中的有害內容。 ShieldGemma 有多種規模,可偵測仇恨、騷擾、性暴露和危險內容。
GemmaScope 則著重透明度。這工具包含一組稀疏自主編碼器 (sparse autoencoder, SAE),是專門化的神經網路,可解析 Gemma 2 複雜的內在結構,以簡單易懂的格式說明資訊處理過程,輔助決策。
這工具提供超過 400 項免費的 SAE 涵括 Gemma 2 2B 和 9B 各層,目的在協助研究人員建立透明而穩定的 AI 系統。
研究和開發人員現在可從多個地方下載 Gemma 2 2B,包括 Kaggle 、 Hugging Face 、 Vertex AI Model Garden,也可在 Google AI Studio 試用。 ShieldGemma 和 Gemma Scope 則可在 Hugging Face 取得。
來源:The Next Web
