OpenAI 昨日發佈最新一代影音生成模型 Sora 2,以及挑戰 Tiktok 的 Sora 社交服務 App 讓使用者生成短影音並分享給友人。
第一代 Sora 是 2024 年 2 月推出,但 OpenAI 表示,相對於大語言模型,當時影片生成模型都還相當不成熟。早期模型會為了滿足文字提示而扭曲事實。例如籃球選手如果投不準,球也會自動飛進籃框,但在 Sora 2,球會擦板後彈出來。
OpenAI 表示,Sora 2 強化了物理定律跟從能力,使影片更為寫實,也就是影片中不只有成功情境,也會失敗情境。此外,Sora 2 的可控制性也大幅提升,能遵從跨好幾個分鏡的複雜指令,同時準確持續真實世界的狀態,它尤其擅長產生真實、電影和動漫風格的影像。
Sora 2 是通用型影音生成系統,能產生進階的背景聲音、人聲和逼真的音效。除此之外,使用者還能將真實影片上傳到 Sora 2 生成的環境,並且毫無違和感。這項能力適用於任何人、動物或物件。
而連同 Sora 2,OpenAI 也推出了第一個 (iOS 版) 社交 App,名為 Sora 。 Sora 是以 Sora 2 為底層。利用 Sora App,用戶可以自行生成影片分享給朋友、觀看他人作品、混合彼此的影片。甚至在你上傳了一段短影音完成驗證後,也可以利用 cameos 功能把你自己「丟」進 Sora 生成的場景中,產生逼真的影片。 OpenAI 表示,cameos 功能是體驗 Sora 2 魔法的最佳方法。
目前 Sora App 僅提供邀請測試,以確保 Sora App 是運用於朋友之間共享影片。但為了保護青少年,OpenAI 也推出整合 ChatGPT 的對話介面,讓父母可以取消無限制滑手機的自由、關閉演算法個人化,以及管理私訊設定等。
OpenAI 表示 Sora 2 開啟了共同創作影片的全新時代,也分享了 Sora 2 的精彩範例,有沙灘排球、滑板特技、體操與跳板縱身一躍等等讓使用者搶先見識。
來源:OpenAI
