Meta發佈Emu Video及Emu Edit 文字即可產生動畫與影片

Meta推出Emu Video及Emu Edit，用戶可用文字產生、編輯影片，提升社交媒體互動及創造力。

Meta 昨 (16) 日公佈圖像短動畫生成式 AI 工具：Emu Video 及 Emu Edit，以自然語言文字輸入，即可生成數分鐘的影片，還能編輯成自己想要的樣子。

Meta 是在九月 Expressive Media Universe(Emu) 專案下開發這些工具。 Emu Video 結合 Emu Edit，顯示 Meta 正在準備為社交媒體 App 如臉書、 IG (Instagram) 加入更直覺化及富創意的使用體驗。

Emu Edit 希望提供使用者更精細控制圖片編輯的能力。和其他影片編輯軟體相比，它很特別的是允許用戶輸入文字化的圖片變更指令。這類似 Adobe Photoshop 現有的「生成式填滿」(generative fill) 功能。

Emu Edit 可提供多種編輯任務，像是局部編輯和全面編輯，強化或移除背景、色彩及幾何轉換，物件偵測及分割等。更重要的是，Emu Edit 將修改限制到與編輯呼叫相關的區域，以確保不會動到不相關的像素。

Emu Edit 是以 1000 萬張合成圖片樣本為資料集訓練，使其得以提供符合指令要求的高品質生成結果。例如使用者希望輸出加上「Aloha!」字樣的棒球帽圖片，Emu Edit 不用變更帽子就能完成這工作。

Meta 的 AI 團隊也發表了 Emu Video 。 Emu Video 是以擴散模型為基礎，為一文字轉圖片生成模型。它支援多種輸入，包括純文字、純圖片、或雙模輸入。

Emu Video 的影片生成過程包括以文字提示調整圖片，再根據圖片及另一文字提示製作影片。若你有興趣試用 Emu Video，也可以參考完整研究論文。

這些新技術可望改變使用者在社群平台上與圖片及影片的互動。例如他們可以自製動畫貼圖和 GIF，或者簡單編輯相片。不過這些工具都還在開發中，尚未能運用於 Facebook 和 IG 上。

對 Meta 而言，Emu 家族代表生成式 AI 的研發成果，可補強 Make-A-Video 及 AI 影片生成模型 DALL-E，進而提供廣大用戶的藝術化可能性。

雖然新工具潛力無窮，但仍有 AI 倫理及內容監管問題。一如其他生成式模型，Emu 需要監管以防範可能的濫用。 Meta 表示，對生成式 AI 而言，安全目前仍然是第一要務。

目前 Edit Video 和 Edit Edit 仍為測試版，並沒有正式上線的時程。但 Meta 源源不絕的研究能量顯示它的社交平台將出現重大體驗變革。 AI 合成技術日愈成熟，使用者總有一天只要送出文字，即可生成專業等的內容。

Meta 發佈 Emu Video 及 Emu Edit 文字即可產生動畫與影片