OpenAI 宣佈通用型代理人 ChatGPT agent,集結工具使用、思考及互動能力,能控制整台電腦來為你代勞。
OpenAI 高層指出,ChatGPT agent 底層模型是專為它打造,整合 Operator 、 Deep Research 等所有代理人能力,能根據用戶指示處理從頭到尾的複雜工作流程,幫用戶完成一項任務。例如它可讀取用戶行事曆,再向你匯款之後的會議行程,或是設計並採購材料製作日式早餐,或根據競爭者建立商務簡報。
ChatGPT agent 的底層模型的訓練資料為需要多種工具,如文字瀏覽器、虛擬瀏覽器和終端機的複雜任務,再以強化式學習訓練而成。
ChatGPT 將全面接管你的數位生活
OpenAI 說,為了打造 ChatGPT agent,該公司集結了 Operator 、 Deep Research 團隊,涵括 20 到 35 名產品開發和研究人員。在一項示範中,使用者要求 ChatGPT agent 設計晚上約會,先連結 Google Calendar 看他們何時有空,再連到 OpenTable 查詢特定類型餐廳的預約狀況,並且預約位子。使用者也可以中途打斷,例如加入搜尋其他類型的餐廳。此外,OpenAI 也示範了 ChatGPT agent 研究比較了拉布布 (Labubu) 和豆豆娃的興起歷史。
OpenAI 今年一月公佈了 Operator,號稱能代用戶上網執行動作,像是填文字、按按鍵、拉卷軸等。 Deep Research 更是受歡迎的功能,它能根據用戶查詢主題,反覆搜尋網頁內容、分析並製作成一份高品質報告。
OpenAI 產品主管 Isa Fulford 說,ChatGPT agent 更有效整合 Operator 和 Deep Research,比單單的 Operator 搜尋更為徹底。 OpenAI 說,ChatGPT agent 可使用整台電腦,而非單一瀏覽器,因此使用的工具更為全面。依據複雜性,大部份任務會在 5 到 30 分鐘內完成。用戶也可以在排程中設定 ChatGPT agent 每天、每周或每月重覆執行某個任務。
為了避免 ChatGPT agent 做了什麼無法挽回的事,像是寄出電子郵件或下單買了一輛車,它做這些事前都會徵求用戶的同意。而且,OpenAI 也加入安全護欄,以免協助人類造成實質的武器傷害。
OpenAI 現在已經 ChatGPT agent 推向付費方案 Pro 、 Plus 、 Teams 用戶,他們可以在選單中選擇「agent mode」或輸入/agent 來啟用。 Enterprise 和 Edu 用戶未來幾個禮拜內也可開始使用。現在歐洲經濟區及瑞士用戶還不能使用,但 OpenAI 表示他們仍計畫之後會推向這些地區。
AI 代理人一詞在 2023 年逐步在投資人及科技公司間興起,並在 2024 年 2 月金融科技業者 Klarna 發表 AI 客服代理人服務後快速走紅,它處理了 2/3 的客服對話,相當於 700 位全職客服員工。此後 Amazon 、 Meta 、 Google 無不全面跟進。而 AI 代理人開發競賽也引發搶人才大戰。例如 Google 上周挖走了 WindSurf CEO 、創辦人及一組研發團隊、之前是延攬 Character.AI 執行長。 Meta 則連續挖角 Scale AI 執行長來掌理超級智慧實驗室,本周又收購了語言 AI 新創公司 Play AI 。
來源:The Verge

2 comments
versatilecherryblossom349d8bcf87
2025-07-22 at 17:28:26
視頻看不到
謝至恩
2025-07-24 at 01:43:06
可點選 https://openai.com/zh-Hant/index/introducing-chatgpt-agent/ 觀看相關影片