Meta 推出輕量化 LLM-Llama 3.3 70B,號稱效能堪比參數值達 4,050 億的 405B 模型

Meta推出Llama 3.3 70B生成式AI模型,效能媲美Llama 3.1 405B,成本更低。Llama 3.3在語言理解、多項測試中超越GPT-4o等競爭者,適用商用與研究情境,並開放原始碼供下載。

Meta 宣佈以 Llama LLM 縮小的生成式 AI 模型 Llama 3.3 70B,成為該家族最新成員。

Meta 生成式 AI 副總裁 Ahmad AI-Dahle 指出 Llama 3.3 為純文字模型,雖然參數量僅 70 億,但能提供最大模型 Llama 3.1 405B 的相同效能,但成本較低。

Meta 公佈了圖表,Llama 3.3 的效能在多項標竿測試超越 Gemini 1.5 Pro 、 OpenAI GPT-4o 和 Amazon Nova Pro,包括測試語言理解能力的 MMLU 。 Meta 發言人表示,Llama 3.3 在數學、一般知識、指令跟從和 App 使用等能力也都大幅改善。

Llama 3.3 適用於多語言的商用及研究情境。 Llama 3.3 有二類,一是指令調校的純文字語言模型,適合作為助理聊天機器人,另一為預訓練模型版本,可用於多種自然語言生成任務。 Llama3.3 輸出還可用於改良其他模型,包括生成合成資料以及模型蒸餾 (distillation) 。

Llama 3.3 現已透過 Llama 3.3 社群授權開放原始碼,現在可從 HuggingFace 和 Llama 網站下載。 Llama 3.3 的授權要求每月用戶超過 7 億的平台必須申請特殊授權,但許多人認為,Llama 嚴格來說並非開放模型。

Llama 3.3 也是 Meta 企圖以開放模型之姿主導 AI 界的最新嘗試。 Llama 現在總下載次數已超越 650 萬。

來源:Techcrunch

發表迴響

關於我們

自 1990 年創刊 UXmaster 雜誌,1991 年獲得美國 LAN Magazine 獨家授權中文版,2006 年獲得 CMP Network Computing 授權,2009 年合併 CMP Network Magazine 獨家授權中文版,2014 年轉型為《網路資訊》雜誌網站,為台灣中小企業協助技術領導者落實企業策略,了解網路規劃及應用,為企業網路應用、管理、 MIS 、 IT 人員必備之專業雜誌網站。


與我們聯絡

加入《網路資訊》雜誌社群

© Copyright 2025 本站版權所有,禁止任意轉載 網路資訊雜誌 / 心動傳媒股份有限公司 聯絡電話:+886 2 29432416

探索更多來自 網路資訊雜誌 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading

Secret Link