OpenAI 12 連發第六、七天:ChatGPT 發表能看懂影片的進階語音模式與專案管理功能

OpenAI推出Advanced Voice Mode支援影片、螢幕共享及圖片上傳,ChatGPT能理解即時影片和螢幕內容。此外,新功能「Projects」提供專案管理,支援儲存對話及檔案,逐步推向付費用戶。

上周 OpenAI 為 Advanced Voice Mode (進階語音模式) 加入影片、螢幕共享。並推出 ChatGPT Projects 專案管理功能,成為十二訊息連發的最新宣佈。

ChatGPT 啟動視訊模式,可以看著你的世界

OpenAI 在 7 個月前預告後,OpenAI 為 Advanced Voice Mode (進階語音模式) 加入影片、螢幕共享、圖片上傳。有了影片支援,現在 ChatGPT 終於能看懂即時影片。訂閱 ChatGPT Plus 、 Teams 或 Pro 方案的用戶可以將他們的 ChatGPT 應用程式對準電視讓它看影片回答問題,或是直接和它視訊,例如讓聊天機器人手把手教你如何泡咖啡。透過螢幕共享功能,ChatGPT 將能理解手機螢幕上的內容,例如它可以解釋設定選單,或是幫忙解決一道數學題。而圖片上傳的功能允許用戶在 ChatGPT 上傳圖片,例如問它這是什麼,或任何你想知道的資訊。

要使用 Advanced Voice Mode 新功能,手機版的 ChatGPT App 必須要升級到最新版,Android App 為 1.2024.337 版,而 iOS App 為 1.2024.339 版。完成後,點選 ChatGPT 聊天對話框左下角的影片圖示開啟。要使用共享螢幕則點選展開三點式選單,從中選擇「Share Screen」。

不過在 demo 影片中,OpenAI 誠實展示 Advanced Voice Mode with Vision 答錯幾何題,顯示還是會有 AI 幻覺的問題。

OpenAI 上周四開始部署 Advanced Voice Mode with vision,預計本周完成。不過 ChatGPT Enterprise 和 Edu 用戶要等到明年一月。至於歐盟、瑞士、冰島、挪威及列支敦士登何時能享用這功能還沒有明確時間表。

第七天:新增專案 (Project) 管理功能

在第七天,OpenAI 終於引入一個類似 Claude 的專案管理「Projects」功能。 Projects 可將對話內容、檔案和自訂指令儲存於單一個地方以方便管理。 Projects 支援 OpenAI 的現有功能,包括 Canvas 文件編輯、進階資料分析、 DALL-E 及搜尋。

點擊 Projects 右上角的「+」可建立新專案,使用「Add instruction」可自訂指令。建立的專案可以刪除,也可以在 Web 版或 Windows App 編輯。不過 macOS 和手機 App 中只支援讀取專案和對話,無法編輯。

目前 Projects 似乎急著推出,許多功能還不完整,例如使用 GPT-4o 模型無法轉換,上傳檔案來源不支援 Google Drive 或 Microsoft OneDrive 。還有,這功能僅提供個人使用,無法分享給其他人。

Projects 將陸續推向所有 ChatGPT 付費用戶,包括 Teams 、 Plus 、 Pro 方案,但 ChatGPT Enterprise 及 Edu 方案用戶要等到明年初。

來源:TechcrunchOpenAI

發表迴響

關於我們

自 1990 年創刊 UXmaster 雜誌,1991 年獲得美國 LAN Magazine 獨家授權中文版,2006 年獲得 CMP Network Computing 授權,2009 年合併 CMP Network Magazine 獨家授權中文版,2014 年轉型為《網路資訊》雜誌網站,為台灣中小企業協助技術領導者落實企業策略,了解網路規劃及應用,為企業網路應用、管理、 MIS 、 IT 人員必備之專業雜誌網站。


與我們聯絡

加入《網路資訊》雜誌社群

© Copyright 2025 本站版權所有,禁止任意轉載 網路資訊雜誌 / 心動傳媒股份有限公司 聯絡電話:+886 2 29432416

探索更多來自 網路資訊雜誌 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading

Secret Link