OpenAI 推出 GPT-4o Mini 效能表現超過 Llama 3 8b 或 Claude Haiku

OpenAI 發布 GPT-4o Mini,小型高效 AI 模型,性能優於 Llama 3 8b 和 Claude Haiku,並以更低成本支援文字和視覺應用。

OpenAI 於週四推出了最新的小型 AI 模型 GPT-4o Mini,這款模型不僅比公司目前最先進的 AI 模型更便宜、更快,還在多項基準測試中展現出優異的表現。從即日起,開發者和消費者可通過 OpenAI API 、 ChatGPT 網頁和行動應用使用 GPT-4o Mini,企業用戶則將於 7 月 22 日當週獲得存取權限。

OpenAI 在部落格文章中表示:「我們希望未來每個應用程式和網站都能無縫整合 AI 模型。 GPT-4o Mini 正為開發者鋪平道路,使他們能更高效、更經濟的方式打造強大的 AI 應用。」

OpenAI 沒有透露 GPT-4o mini 的確切大小,但表示它大致處於與其他小型 AI 模型相同的層級,如 Llama 3 8b 、 Claude Haiku 和 Gemini 1.5 Flash 。然而,該公司聲稱,根據在 LMSYS.org 聊天機器人競技場的發布前測試,GPT-4o mini 比業界領先的小型模型更快、更具成本效益且更聰明。早期的獨立測試似乎證實了這一點。

效能與競爭優勢

GPT-4o mini 與其他小型 LLM 的測試比較結果

GPT-4o Mini 在涉及文字和視覺的推理任務上表現出色,超越了業界其他領先的小型 AI 模型。在 MMLU(衡量推理能力的基準)測試中,GPT-4o Mini 得分 82%,高於 Google 的 Gemini 1.5 Flash(79%) 和 Anthropic 的 Claude 3 Haiku(75%) 。在衡量數學推理的 MGSM 測試中,GPT-4o Mini 更是以 87% 的得分遙遙領先,而 Gemini 1.5 Flash 和 Claude 3 Haiku 分別只獲得 78% 和 72% 的成績。

對於開發者而言,GPT-4o Mini 的使用成本顯著降低。每百萬輸入 token 僅需 15 美分,每百萬輸出 token 僅 60 美分,比 GPT-3.5 Turbo 便宜 60% 以上。相較之下,GPT-4o 的價格為每百萬輸入 token 要 5 美元,每百萬輸出 token 為 2.5 美元。 OpenAI 的產品 API 負責人 Olivier Godement 表示:「要讓世界每個角落都能被 AI 賦能,我們需要使模型更加實惠。 GPT-4o Mini 在這個方向上是一個很大的進步。」

技術規格與功能

  1. 上下文窗口:GPT-4o Mini 擁有 128,000 個 token 的上下文窗口,與 GPT-4o 相同,遠超 GPT-3.5 Turbo 的 16,000 個 token 。
  2. 知識截止日期:2023 年 10 月。
  3. 當前功能:支援文字和視覺輸入。
  4. 未來規劃:OpenAI 表示將加入視訊和音訊功能支援。

GPT-4o Mini 的推出反映了 AI 產業朝向更輕量、高效的小型語言模型發展的趨勢。這類模型在保持 AI 效能的同時,大幅降低了運算資源需求和成本。微軟的 Phi-3 Mini 和 Google 的 Gemini 1.5 Flash 都是類似的嘗試,分別針對手機、個人電腦運行和高頻率任務而設計。

發表迴響

關於我們

自 1990 年創刊 UXmaster 雜誌,1991 年獲得美國 LAN Magazine 獨家授權中文版,2006 年獲得 CMP Network Computing 授權,2009 年合併 CMP Network Magazine 獨家授權中文版,2014 年轉型為《網路資訊》雜誌網站,為台灣中小企業協助技術領導者落實企業策略,了解網路規劃及應用,為企業網路應用、管理、 MIS 、 IT 人員必備之專業雜誌網站。


與我們聯絡

加入《網路資訊》雜誌社群

© Copyright 2025 本站版權所有,禁止任意轉載 網路資訊雜誌 / 心動傳媒股份有限公司 聯絡電話:+886 2 29432416

探索更多來自 網路資訊雜誌 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading

Secret Link