ChatGPT 開放 DALL-E 3 畫圖 宣布 AI 圖片辨識器開發中
OpenAI 本周將最新版 DALL-E 3 開放給 ChatGPT Plus 訂閱服務(每月 20 美元起跳)及企業用的 ChatGPT for Enterprise。
OpenAI 表示,和前一代相比,DALL-E 產生的圖不但更鮮活,細節也更清楚。DALL-E 3 可以穩定生成繁複細節,包括文字、手部和臉部。此外,它特別善於回應多種或更複雜的提示,也同時支援橫向及直向長寬比的圖片。
另外,DALL-E 3 還允許使用者產生嵌入圖片的文字,這對行銷、品牌和其他商務用的視覺內容,例如促銷圖片或銷售材料。這樣一來,DALL-E 3 就比一些純圖片產生的 AI 服務如 Adobe Firefly 2 及 Midjourney 提供更多的功能。
OpenAI 也提供了一些從 ChatGPT Plus 使用 DALL-E 3 生成圖片的範例,包括產生學校報告或公司 Logo 要用的圖片。
AI 圖像分類器對抗假訊息、政治宣傳
此外,OpenAI 本周也發佈研究報告,說明它如何開發 DALL-E 3,並表示它正在開發圖片分類器,以對抗假資訊。過去幾周以色列和哈瑪斯衝突以來,AI 生成的假資訊愈來愈氾濫。OpenAI 指出,該公司內部開發的工具能協助他們辨識一張圖片是否為 DALL-E 生成。早期評估顯示,如果圖片未經修改,他們的工具辨識是否為 DALL-生成的準確率達 99%。若圖片經過常見變更,如剪裁、調整大小、JPEG 壓縮,或是把文字或從真實圖片剪下的圖片,再移花接木到別的生成圖片上,則辨識率也有 95%。
不過即使如此,這個分類器目前只能判斷可能由 DALL-E 生成的圖片,但無法提供明確結論。未來這個分類器可能成為一組強大工具的一員,協助用戶判斷是否為 AI 生成的聲音或圖像。
這分類器顯然是 OpenAI 想展現它對產品的責任感。不過 OpenAI 之前曾經推出號稱能判讀 AI 生成的文字,不過才半年就撤下了,原因此準確率太低,還可能誤判人類生成的以及 AI 生成的文字,尤其是外國人的作品。不過 OpenAI 尚未說明分類器何時會開發完成。
來源:VentureBeat