OpenAI 於週四推出了最新的小型 AI 模型 GPT-4o Mini,這款模型不僅比公司目前最先進的 AI 模型更便宜、更快,還在多項基準測試中展現出優異的表現。從即日起,開發者和消費者可通過 OpenAI API 、 ChatGPT 網頁和行動應用使用 GPT-4o Mini,企業用戶則將於 7 月 22 日當週獲得存取權限。
OpenAI 在部落格文章中表示:「我們希望未來每個應用程式和網站都能無縫整合 AI 模型。 GPT-4o Mini 正為開發者鋪平道路,使他們能更高效、更經濟的方式打造強大的 AI 應用。」
OpenAI 沒有透露 GPT-4o mini 的確切大小,但表示它大致處於與其他小型 AI 模型相同的層級,如 Llama 3 8b 、 Claude Haiku 和 Gemini 1.5 Flash 。然而,該公司聲稱,根據在 LMSYS.org 聊天機器人競技場的發布前測試,GPT-4o mini 比業界領先的小型模型更快、更具成本效益且更聰明。早期的獨立測試似乎證實了這一點。
本文目錄
效能與競爭優勢

GPT-4o Mini 在涉及文字和視覺的推理任務上表現出色,超越了業界其他領先的小型 AI 模型。在 MMLU(衡量推理能力的基準)測試中,GPT-4o Mini 得分 82%,高於 Google 的 Gemini 1.5 Flash(79%) 和 Anthropic 的 Claude 3 Haiku(75%) 。在衡量數學推理的 MGSM 測試中,GPT-4o Mini 更是以 87% 的得分遙遙領先,而 Gemini 1.5 Flash 和 Claude 3 Haiku 分別只獲得 78% 和 72% 的成績。
對於開發者而言,GPT-4o Mini 的使用成本顯著降低。每百萬輸入 token 僅需 15 美分,每百萬輸出 token 僅 60 美分,比 GPT-3.5 Turbo 便宜 60% 以上。相較之下,GPT-4o 的價格為每百萬輸入 token 要 5 美元,每百萬輸出 token 為 2.5 美元。 OpenAI 的產品 API 負責人 Olivier Godement 表示:「要讓世界每個角落都能被 AI 賦能,我們需要使模型更加實惠。 GPT-4o Mini 在這個方向上是一個很大的進步。」
技術規格與功能
- 上下文窗口:GPT-4o Mini 擁有 128,000 個 token 的上下文窗口,與 GPT-4o 相同,遠超 GPT-3.5 Turbo 的 16,000 個 token 。
- 知識截止日期:2023 年 10 月。
- 當前功能:支援文字和視覺輸入。
- 未來規劃:OpenAI 表示將加入視訊和音訊功能支援。
GPT-4o Mini 的推出反映了 AI 產業朝向更輕量、高效的小型語言模型發展的趨勢。這類模型在保持 AI 效能的同時,大幅降低了運算資源需求和成本。微軟的 Phi-3 Mini 和 Google 的 Gemini 1.5 Flash 都是類似的嘗試,分別針對手機、個人電腦運行和高頻率任務而設計。
