在各家大廠競相發表 AI 開發成果的年底,微軟也不甘落人於後,發表了可於裝置上執行的最新版 AI 模型 Phi-4,強調參數僅 140 億,但具備強大複雜推理能力。
Phi-4 是微軟小語言模型 (SLM) 最新成員,微軟強調 Phi-4 不只能處理語言,還具備複雜推理能力。之前 Phi 版本是由教師模型,特別是 GPT-4 蒸餾而來,Phi-4 的架構和 Phi-3 medium 相較也沒什麼太大變動,但 Phi-4 在 STEM 領域的問題表現卻超越教師模型及其他同等級模型。原因是團隊使用了高品質的合成資料集、高品質有機資料的配置,以及新發展的後訓練技術。
Phi-4 後訓練技術結合了以 Supervised Fine-Tuning (SFT) 改善的資料集以及用 Pivotal Token Search 方法建立 Direct Preference Optimization (DPO) 資料對二種方法,可提升模型精度、減少標註成本及勝任更多任務。
根據微軟提供的資料,Phi-4 在 MMLU 標竿測試超越了 Phi-3.5 、 Llama 3.18B 、 Mistral-8B 或 Qwen2.5-7B 等小模型。它尤其擅長數學解題能力。 Phi-4 在 AMC 10/12 測試上甚至超越 Llama 3.3-70B 、 GPT4o-mini 、 Gemini 1.5 Flash 及 1.5 Pro 。
Phi-4 目前已經在 Azure AI Foundry 以及 Hugging Face 以微軟研究授權協議 (Microsoft Research License Agreement, MSRLA) 授權公開。
來源:Microsoft
