微軟發表 140 參數輕量模型 Phi-4 強調具備複雜推理能力

微軟發表最新AI模型Phi-4,參數僅140億卻具備強大推理能力,尤其擅長數學解題,表現超越同級模型。Phi-4透過高品質資料與新後訓練技術提升精度,已於Azure AI Foundry與Hugging Face公開。

在各家大廠競相發表 AI 開發成果的年底,微軟也不甘落人於後,發表了可於裝置上執行的最新版 AI 模型 Phi-4,強調參數僅 140 億,但具備強大複雜推理能力。

Phi-4 是微軟小語言模型 (SLM) 最新成員,微軟強調 Phi-4 不只能處理語言,還具備複雜推理能力。之前 Phi 版本是由教師模型,特別是 GPT-4 蒸餾而來,Phi-4 的架構和 Phi-3 medium 相較也沒什麼太大變動,但 Phi-4 在 STEM 領域的問題表現卻超越教師模型及其他同等級模型。原因是團隊使用了高品質的合成資料集、高品質有機資料的配置,以及新發展的後訓練技術。

Phi-4 後訓練技術結合了以 Supervised Fine-Tuning (SFT) 改善的資料集以及用 Pivotal Token Search 方法建立 Direct Preference Optimization  (DPO) 資料對二種方法,可提升模型精度、減少標註成本及勝任更多任務。

根據微軟提供的資料,Phi-4 在 MMLU 標竿測試超越了 Phi-3.5 、 Llama 3.18B 、 Mistral-8B 或 Qwen2.5-7B 等小模型。它尤其擅長數學解題能力。 Phi-4 在 AMC 10/12 測試上甚至超越 Llama 3.3-70B 、 GPT4o-mini 、 Gemini 1.5 Flash 及 1.5 Pro 。

Phi-4 目前已經在 Azure AI Foundry 以及 Hugging Face 以微軟研究授權協議 (Microsoft Research License Agreement, MSRLA) 授權公開。

來源:Microsoft

發表迴響

關於我們

自 1990 年創刊 UXmaster 雜誌,1991 年獲得美國 LAN Magazine 獨家授權中文版,2006 年獲得 CMP Network Computing 授權,2009 年合併 CMP Network Magazine 獨家授權中文版,2014 年轉型為《網路資訊》雜誌網站,為台灣中小企業協助技術領導者落實企業策略,了解網路規劃及應用,為企業網路應用、管理、 MIS 、 IT 人員必備之專業雜誌網站。


與我們聯絡

加入《網路資訊》雜誌社群

© Copyright 2025 本站版權所有,禁止任意轉載 網路資訊雜誌 / 心動傳媒股份有限公司 聯絡電話:+886 2 29432416

探索更多來自 網路資訊雜誌 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading

Secret Link