微軟發表140參數輕量模型Phi-4 強調具備複雜推理能力

微軟發表最新AI模型Phi-4，參數僅140億卻具備強大推理能力，尤其擅長數學解題，表現超越同級模型。Phi-4透過高品質資料與新後訓練技術提升精度，已於Azure AI Foundry與Hugging Face公開。

在各家大廠競相發表 AI 開發成果的年底，微軟也不甘落人於後，發表了可於裝置上執行的最新版 AI 模型 Phi-4，強調參數僅 140 億，但具備強大複雜推理能力。

Phi-4 是微軟小語言模型 (SLM) 最新成員，微軟強調 Phi-4 不只能處理語言，還具備複雜推理能力。之前 Phi 版本是由教師模型，特別是 GPT-4 蒸餾而來，Phi-4 的架構和 Phi-3 medium 相較也沒什麼太大變動，但 Phi-4 在 STEM 領域的問題表現卻超越教師模型及其他同等級模型。原因是團隊使用了高品質的合成資料集、高品質有機資料的配置，以及新發展的後訓練技術。

Phi-4 後訓練技術結合了以 Supervised Fine-Tuning (SFT) 改善的資料集以及用 Pivotal Token Search 方法建立 Direct Preference Optimization (DPO) 資料對二種方法，可提升模型精度、減少標註成本及勝任更多任務。

根據微軟提供的資料，Phi-4 在 MMLU 標竿測試超越了 Phi-3.5 、 Llama 3.18B 、 Mistral-8B 或 Qwen2.5-7B 等小模型。它尤其擅長數學解題能力。 Phi-4 在 AMC 10/12 測試上甚至超越 Llama 3.3-70B 、 GPT4o-mini 、 Gemini 1.5 Flash 及 1.5 Pro 。

Phi-4 目前已經在 Azure AI Foundry 以及 Hugging Face 以微軟研究授權協議 (Microsoft Research License Agreement, MSRLA) 授權公開。

來源：Microsoft

微軟發表 140 參數輕量模型 Phi-4 強調具備複雜推理能力

相關

previousOpenAI 12連發第六、七天：ChatGPT發表能看懂影片的進階語音模式與專案管理功能

nextOpenAI 12連發第8天：SearchGPT開放免費用戶，支援語音查詢，整合地圖查詢

發表迴響取消回覆

相關

相關

previousOpenAI 12連發第六、七天：ChatGPT發表能看懂影片的進階語音模式與專案管理功能

nextOpenAI 12連發第8天：SearchGPT開放免費用戶，支援語音查詢，整合地圖查詢

發表迴響取消回覆

相關

探索更多來自 網路資訊雜誌 的內容

探索更多來自網路資訊雜誌的內容