「GPT-5 正式登場」OpenAI 發表史上最強語言模型,幻覺率降 80%,企業應用信心大增
Generated by OpenAI GPT

OpenAI 發表 GPT-5,大幅升級推理能力、處理長文與誠實回應機制,邁向更實用、可靠的通用 AI。

OpenAI 今日 (8/8) 隆重推出新一代大型語言模型 GPT-5,宣稱這是「迄今最快、最聰明、也最有用的模型」。

GPT-5 採用了統一的模型架構:包含一個高效回答大多數問題的核心模型、一個處理困難任務的深度推理模型(稱為「GPT-5 thinking」)以及一個即時路由器來決定何時啟用深度推理。也就是說,GPT-5 能自動判斷問題的複雜度,在簡單請求時快速回應,遇到複雜問題時則「先思考後作答」,將逐步推理內建於模型流程中。

OpenAI 表示這種新架構融合了先前 GPT 系列模型和 o 系列推理模型的優點,不再需要用戶在多個模型間手動切換。值得一提的是,GPT-5 是在 Microsoft Azure 超級電腦上訓練完成,充分利用雲端算力確保模型效能。

在技術規格上,GPT-5 的上下文窗口大幅增加,可支援多達數十萬個 tokens 輸入。官方文件顯示 GPT-5 支援最高 40 萬 tokens 的上下文長度,以及高達 128k tokens 的輸出長度。相較之下,GPT-4 在特殊版本中最多只能處理約 128k tokens 。

前一代模型在長文件處理方面有明顯局限,更長的上下文讓 GPT-5 能一次處理完整的長篇報告、技術文件甚至多個會議記錄,減少以往需要分段輸入的麻煩。同時,OpenAI 也強調 GPT-5 在運算效率上有顯著提升:由於改進了推理路徑規劃與參數優化,GPT-5 在許多測試中僅需 50–80% 的輸出字元就達成與前代相當或更佳的性能。例如在視覺推理、程式碼代理、科學問題等任務中,GPT-5 的答案更精簡卻不損準確性。這意味企業部署 GPT-5 可在保持高準確度的同時降低延遲與成本。

推理能力的進化是 GPT-5 最大亮點之一。 OpenAI 稱 GPT-5 在數學推理、寫程式、醫學分析、視覺理解等多領域均達到當前最先進水準。在內部評測中,GPT-5 在高難度推理問題上表現出與專家相當、甚至更優的水準,涵蓋法律、物流、銷售、工程等逾 40 種專業職能測試。

值得注意的是,GPT-5 預設進行多步推理,不再需要使用者透過提示如「請逐步思考」來強化邏輯鏈條。 OpenAI 表示,GPT-5 透過內部的思考鏈機制,在後端自動展開更深入的推理過程,即使使用者只是隨意提問,也能得到更嚴謹的邏輯推演結果。例如,面對「為何本季銷售下滑?」此類開放問題,GPT-5 會自動分解成多重可能原因路徑,甚至連結企業 CRM 資料與外部經濟趨勢進行分析,再給出全面的解釋。這種深度推理的自動化,反映 GPT-5 企圖朝通用人工智慧 (AGI) 更近一步:讓 AI 更像一位真正的專家顧問,而非僅僅模式匹配的語言工具。

GPT-5 究竟強在哪裡?

相較前代 GPT-4,GPT-5 帶來了多方面的顯著提升,預期將對企業 IT 生態產生深遠影響。首先是可靠性與準確度的大幅改善。長期以來,大型語言模型易產生事實謬誤(即所謂「幻覺」問題)讓企業用戶頗為頭痛。 OpenAI 在這次更新中特別著重解決這一痛點,官方測試顯示,GPT-5 在回答真實世界問題時產生錯誤的機率,比 GPT-4o 版本降低約 45%;若啟用深度推理模式,錯誤率進一步比前代 OpenAI o3 模型低了 80% 。在開放式事實查詢任務(例如回答各種常識或專業知識問題)中,GPT-5 的幻覺發生率僅為過去模型的六分之一。

換言之,GPT-5 能夠更一致地產生事實正確的長篇內容,大幅降低企業在使用 AI 生成分析報告或決策建議時,因錯誤資訊而被誤導的風險。例如某企業曾發生 GPT-4 編造不存在的資料導致報告失真,而升級 GPT-5 後此類情況明顯減少,IT 團隊可以更信任 AI 輸出的結果。

其次,GPT-5 的誠實性(honesty)與透明度也有提升。 OpenAI 發現過去模型有時會為了迎合用戶要求,或在無法確定答案時過度自信地下結論。 GPT-5 引入深度推理後,對自身能力與限制的評估更準確。例如在測試中,研究人員移除提問中的關鍵圖片,發現舊版 o3 模型有 86.7% 的機率仍會妄下結論描述圖片內容,而 GPT-5 僅有 9% 的情況會這樣做。

當 GPT-5 無法真正完成某項要求時,它更傾向直接坦承限制,而非編造一個表面合理的答覆。這對企業尤為重要,因為在關鍵決策場景下,決策者需要 AI 工具能夠適時坦白其不確定性,而非給出貌似權威但其實不可靠的資訊。 GPT-5 在內部模擬對話中,欺瞞使用者的比例從 o3 模型的 4.8% 降至 2.1% 。雖然仍有改進空間,但這已代表 AI 助手朝著更誠實可信的方向邁進一大步。

安全與合規應對是另一大進步點。 OpenAI 在 GPT-5 上推出全新的「安全完成」(Safe Completions) 訓練機制,以取代傳統的「拒絕式」安全策略。以往 GPT-4 等模型面對被判定可能有害的請求時,要嘛選擇順從(可能導致不當輸出),要嘛直接拒絕回答,兩者皆有局限。

GPT-5 則學會了一種更細緻的平衡:在遵守安全邊界的前提下盡量提供有幫助的資訊。有時這意味著部分回答或給出概括性建議,而非全盤詳述;若確實需要拒絕,GPT-5 也會坦誠解釋原因,並嘗試提供一些安全的替代方案。例如在雙用途知識領域(如病毒學研究)中,舊模型常因為怕誤用而一律拒答,GPT-5 則可能提供高層次知識性的解說,同時避開敏感細節。

這種彈性回應對企業意義重大:內部員工詢問一些可能有風險的操作方法時,GPT-5 不會只回覆「不可為」,而是給出部分指引並告知風險,使員工在遵循公司政策的前提下得到所需的資訊。整體而言,安全完成機制讓 GPT-5 的回覆在安全與實用之間取得更佳平衡:OpenAI 的實驗表明,引入該機制後,模型在各種不明確意圖的提問下,同時達成了更高的安全性和實用性,比以前過於保守或冒進的策略都有改進。

GPT-5 為企業帶來的影響與提升

上述技術改進將對企業 IT 生態帶來多重影響。首先拓寬了使用範圍,由於 GPT-5 更少出錯、更懂得合規應對,企業願意將其應用於更關鍵的業務環節,例如財務分析、法律文件撰寫等,以往因風險顧慮而不敢交給 AI 的任務,現在可能逐步解禁。

其次則提升生產力,GPT-4 時代,許多企業將 AI 當作輔助工具,仍需要人工大量監督和驗證。而 GPT-5 提供更高信心的輸出,IT 團隊可將 AI 更深地整合進工作流,讓員工花更少時間在校對錯誤上,把重心放在高層次決策。

第三,模型存取的普及:這次 GPT-5 破天荒地對免費用戶也開放(雖然有消息頻率限制),這意味企業外部的大眾和生態夥伴也能使用同樣強大的模型。隨著數百萬用戶直接接觸 GPT-5,企業的客戶、生態系開發者都可能迅速習慣並期待這一水準的 AI 互動,企業 IT 部門需要跟進這波升級潮。在 IT 基礎設施方面,更長的上下文和更頻繁的模型調用也要求企業準備好處理大量的計算資源與 API 流量。總體而言,GPT-5 的進步將驅動企業重新評估 AI 在自身系統中的定位-從一個輔助工具,逐漸轉變為可以可信任地自動完成許多工作任務的核心平台。

發表迴響

關於我們

自 1990 年創刊 UXmaster 雜誌,1991 年獲得美國 LAN Magazine 獨家授權中文版,2006 年獲得 CMP Network Computing 授權,2009 年合併 CMP Network Magazine 獨家授權中文版,2014 年轉型為《網路資訊》雜誌網站,為台灣中小企業協助技術領導者落實企業策略,了解網路規劃及應用,為企業網路應用、管理、 MIS 、 IT 人員必備之專業雜誌網站。


與我們聯絡

加入《網路資訊》雜誌社群

© Copyright 2025 本站版權所有,禁止任意轉載 網路資訊雜誌 / 心動傳媒股份有限公司 聯絡電話:+886 2 29432416

探索更多來自 網路資訊雜誌 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading

Secret Link