Meta 發佈 Emu Video 及 Emu Edit 文字即可產生動畫與影片
Meta 昨 (16) 日公佈圖像短動畫生成式 AI 工具:Emu Video 及 Emu Edit,以自然語言文字輸入,即可生成數分鐘的影片,還能編輯成自己想要的樣子。
Meta 是在九月 Expressive Media Universe(Emu) 專案下開發這些工具。Emu Video 結合 Emu Edit,顯示 Meta 正在準備為社交媒體 App 如臉書、IG (Instagram) 加入更直覺化及富創意的使用體驗。
本文目錄
Emu Edit:提高影片編輯的水準
Emu Edit 希望提供使用者更精細控制圖片編輯的能力。和其他影片編輯軟體相比,它很特別的是允許用戶輸入文字化的圖片變更指令。這類似 Adobe Photoshop 現有的「生成式填滿」(generative fill) 功能。
Emu Edit 可提供多種編輯任務,像是局部編輯和全面編輯,強化或移除背景、色彩及幾何轉換,物件偵測及分割等。更重要的是,Emu Edit 將修改限制到與編輯呼叫相關的區域,以確保不會動到不相關的像素。
Emu Edit 是以 1000 萬張合成圖片樣本為資料集訓練,使其得以提供符合指令要求的高品質生成結果。例如使用者希望輸出加上「Aloha!」字樣的棒球帽圖片,Emu Edit 不用變更帽子就能完成這工作。
Emu Video:文字轉影片更為簡單
Meta 的 AI 團隊也發表了 Emu Video。Emu Video 是以擴散模型為基礎,為一文字轉圖片生成模型。它支援多種輸入,包括純文字、純圖片、或雙模輸入。
Emu Video 的影片生成過程包括以文字提示調整圖片,再根據圖片及另一文字提示製作影片。若你有興趣試用 Emu Video,也可以參考完整研究論文。
對內容生成帶來深遠影像
這些新技術可望改變使用者在社群平台上與圖片及影片的互動。例如他們可以自製動畫貼圖和 GIF,或者簡單編輯相片。不過這些工具都還在開發中,尚未能運用於 Facebook 和 IG 上。
對 Meta 而言,Emu 家族代表生成式 AI 的研發成果,可補強 Make-A-Video 及 AI 影片生成模型 DALL-E,進而提供廣大用戶的藝術化可能性。
雖然新工具潛力無窮,但仍有 AI 倫理及內容監管問題。一如其他生成式模型,Emu 需要監管以防範可能的濫用。Meta 表示,對生成式 AI 而言,安全目前仍然是第一要務。
目前 Edit Video 和 Edit Edit 仍為測試版,並沒有正式上線的時程。但 Meta 源源不絕的研究能量顯示它的社交平台將出現重大體驗變革。AI 合成技術日愈成熟,使用者總有一天只要送出文字,即可生成專業等的內容。
來源:VentureBeat