就在各大產業為 ChatGPT 為之瘋狂的這段日子,OpenAI 前些日子突襲式推出新的大型語言模型「GPT-4」。它不僅能處理比 ChatGPT 多 8 倍的長篇內容、回覆內容更精準、圖像辨識功能還可以解讀圖片中文字,並根據文字內容給出完整建議。
目前美國支付新創 Stripe 、美國語言學習網站 Duolingo 、美國國際金融服務公司摩根士丹利,以及冰島政府已與 OpenAI 達成合作開始使用 GPT-4,微軟新版 Bing 瀏覽器的聊天功能也已導入其功能。
本文目錄
國際企業、新創紛紛引入 GPT-4,ChatGPT 有哪些新的特色?
特色一:可記憶的 Token 數翻 4 倍,可連續處理數小時、數天的內容運算
從 OpenAI 官網釋出的消息得知,GPT-4 可支援圖片輸入並轉譯成文字,即便只是簡單的筆記、摘要的文字圖片,它也可以做成完整的文字建議。

現有的版本中,GPT-4 可記憶的 Token 數約 8,192 個,未來版本將持續更新至 32,768 個(共計可容納 50 頁;約 2.5 萬字長篇 A4 的內容),比過往 ChatGPT 多 8 倍以上。
特色二:準確度更高,實力媲美國際生物奧林匹亞第 99 個百分位、美國律師資格模擬考前 10%
OpenAI 指出,受惠於微軟雲端服務平台 Azure,它們才得以在 2 年內的時間訓練出 GPT-4 。為了降低內容錯誤率和精準度,前後共花費 6 個月的時間,順利將 GPT-4 的不實資訊、不當回覆與敏感字詞可能性皆降低 60% 。
經 OpenAI 實測約 30 種不同考試項目,GPT-4 在美國律師資格模擬考 (Uniform Bar Exam, UBE) 的成績是應試者們的前 10%;美國大學入學測驗 (SAT) 滿分 1600 中更是拿到 1300 分的高成績,等於擁有入學美國加州大學柏克萊分校 (University of California, Berkeley) 的資格。

至於大眾最在乎的精準度部分,GPT-4 相比前 GPT-3.5 正確率高 40%,處理非英語系語言的處理能力精準度也有提升,精準度 80% 以上的語言,包含中文就有 14 種。 GPT-4 和 GPT-3.5 兩者精準度最大的差異,可能來自於 GPT-4 能使用圖片和文字訓練,而 GPT-3.5 、 GPT-3 都只能用文字訓練的緣故。
不過 OpenAI 指出 GPT-4 還是有技術上的限制,像是會捏造與事實不相符的資訊,並在錯誤的情境下堅持自己是對的「幻覺(hallucination)」問題。

但具體的技術細節、資料量的使用 OpenAI 沒有多做說明,訓練模型的部分僅僅提到使用人工回饋來進行強化學習(Reinforcement Learning from Human Feedback,簡稱 RLHF),可以把它想像成訓練 AI 的一種工具。圖片輸入轉文字尚在第一個 Alpha 測試階段,撈取的資料跟 GPT-3.5 一樣皆為 2021(含)以前的數據。
