上個月 OpenAI 推出一版本 GPT4o 更新,引發使用者覺得過份阿諛,致使 OpenAI 上星期撤回。 OpenAI 並在公司部落格解釋來龍去脈。
4 月時,OpenAI 推出 GPT-4o 模型的 ChatGPT,但有愈來愈多用戶覺得 ChatGPT 的回應似乎太順從、恭維用戶想法,甚至到了有害的程度。
據美國《滾石》(Rolling Stone) 報導,許多人在和 ChatGPT 的對話過程中變得沈迷於自己的幻想。例如 ChatGPT 給了一名熱衷探討宇宙奧祕的用戶一個可下載「古老檔案」的連結及跨時空移動的裝置。一名女性在 ChatGPT 的附和下認為自己有和上帝、天使通話的能力,並相信老公是 CIA 派來監視她的。 ChatGPT 不斷讚美另一名男性,使他相信自己是下一個救世主。
由於 ChatGPT 引發眾多用戶(的另一半)抱怨,迫使 OpenAI 在 4 月 24 日推出 GPT-4o 更新,5 天後就撤回。 OpenAI 執行長 Sam Altman 承認最新版 GPT-4o「太諂媚而惱人」。
OpenAI 解釋,問題出在測試階段,雖然一些專家測試員覺得更新版使 ChatGPT「有點偏差」,但模型離線評估和 A/B 測試結果又很正面,例如他們使用用戶回饋的「讚」或「倒讚」鍵作為回饋訊號,忽略了質化的訊息,使 OpenAI 決定就用這個版本公開。二個評估標準都未能有效發現模型過於諂媚。
OpenAI 表示未來測試時會考量行為問題,以便及時阻止,也會加入新的 Alpha 版 opt-in 選項,以便測試人員能給予直接回饋意見。此外,OpenAI 也說未來計畫提醒使用者模型新增之處何在。
來源:The Verge 、 Rolling Stone
