Meta 宣佈以 Llama LLM 縮小的生成式 AI 模型 Llama 3.3 70B,成為該家族最新成員。
Meta 生成式 AI 副總裁 Ahmad AI-Dahle 指出 Llama 3.3 為純文字模型,雖然參數量僅 70 億,但能提供最大模型 Llama 3.1 405B 的相同效能,但成本較低。
Meta 公佈了圖表,Llama 3.3 的效能在多項標竿測試超越 Gemini 1.5 Pro 、 OpenAI GPT-4o 和 Amazon Nova Pro,包括測試語言理解能力的 MMLU 。 Meta 發言人表示,Llama 3.3 在數學、一般知識、指令跟從和 App 使用等能力也都大幅改善。
Llama 3.3 適用於多語言的商用及研究情境。 Llama 3.3 有二類,一是指令調校的純文字語言模型,適合作為助理聊天機器人,另一為預訓練模型版本,可用於多種自然語言生成任務。 Llama3.3 輸出還可用於改良其他模型,包括生成合成資料以及模型蒸餾 (distillation) 。
Llama 3.3 現已透過 Llama 3.3 社群授權開放原始碼,現在可從 HuggingFace 和 Llama 網站下載。 Llama 3.3 的授權要求每月用戶超過 7 億的平台必須申請特殊授權,但許多人認為,Llama 嚴格來說並非開放模型。
Llama 3.3 也是 Meta 企圖以開放模型之姿主導 AI 界的最新嘗試。 Llama 現在總下載次數已超越 650 萬。
來源:Techcrunch
