OpenAI 3 月 5 日推出 GPT-5.4 模型,可為 ChatGPT 及 Codex 能力升級,首次加入電腦使用能力,還可作為 Excel 外掛,協助複雜的開發作業。
GPT-5.4 整合了推理、程式撰寫及代理人工作流程的最新技術,納入 GPT-5.3-Codex 領先業界的程式撰寫能力,以及模型跨工具(如試算表、簡報與文件)、軟體環境與專業任務的能力,大幅提升開發人員生產力,其精準理解及回應能力減少用戶來回搜尋和詢問。
即日起 GPT-5.4 已部署至 ChatGPT 、 API 與 Codex,ChatGPT 和 API 同時支援新的 GPT-5.4 Pro,為需要處理複雜任務的用戶提供更高效能。
細部而言,GPT-5.4 依然以推理見長,通用推理能力以 GPT-5.2 為基礎,但回應更一致且簡練。同時也強化了專業任務能力,使用者可在 GPT-5.4 Thinking 或 Pro 模式中,體驗 ChatGPT 更強的編輯與建立試算表、簡報和文件等新技能。 OpenAI 還推出了 ChatGPT for Excel 外掛,供 ChatGPT Enterprise 用戶使用。在 ChatGPT 中,GPT-5.4 Thinking 模式強化深入網頁研究 (deep web search) 及維持脈絡的能力,以支援長時間思考;用戶也可以調整回應順序,在完整輸入需求後再讓模型思考,以取得更精準的答案。
在 Codex 和 API 中,GPT-5.4 首度原生支援電腦工具使用,透過連接器 (connector) 串接工具,並規劃、執行方案及驗證結果。它還支援工具搜尋功能,讓代理人快速找到適合的工具執行任務。舉例來說,現在它可撰寫程式透過 Playwright 等函式庫來操作電腦,也可對螢幕截圖發出滑鼠和鍵盤指令。此外,使用者也能輕鬆調整其行為,以確保合規及安全性。
GPT-5.4 也是最省 token 的推理模型,意味著更省成本、速度更快。一家客戶表示,GPT-5.4 與其他電腦使用代理人 (CUA) 模型相比,完成一項任務的速度快了 3 倍,但使用的 token 少了 70% 。
OpenAI 表示,GPT-5.4 整合了推理、 GPT-5.3-Codex 的程式撰寫和電腦工具能力,使其成為開發網頁及應用程式代理人的最佳模型。
來源: OPENAI
