Google 執行長終於展示傳說中的長片產生器 Phenaki 打字即可拍影片
Google 開發 AI 影像產生技術好一陣子之後,上周 Google CEO Sundar Pichai 終於公佈了該公司正在開發中的影片產生器模型 Phenaki。
Google 有二種文字轉影片的 AI 產製工具,第一個是 Imagen,能讓用戶輸入文字以產生影片。而 Phenaki 則可以文字產生較長的影片。這意謂著 AI 文字轉影片生成工具可由營運者來「導演」。
Pichai 在其推特頁面展示了 Phenaki 的影片,這是該公司第一次分享 Phenaki 根據文字提示產生較長、敍事有條理的超高解析度影片,或是利用 Imagen Video 工具來提升影片畫質。
1/ From today’s AI@ event: we announced our Imagen text-to-image model is coming soon to AI Test Kitchen. And for the 1st time, we shared an AI-generated super-resolution video using Phenaki to generate long, coherent videos from text prompts and Imagen Video to increase quality. pic.twitter.com/WofU5J5eZV
— Sundar Pichai (@sundarpichai) November 2, 2022
Phenaki 和 Imagen Video 模型差別在於它是將多段影片片段合成,而使之有不同場景。這類似電影分鏡表,導演可以一幕一幕計畫,只是電影是攝影機拍的,而 AI 影片,是 AI 模型生成的。Imagen 只能產生幾秒鐘影片,但 Google 說,Phenaki 可以產生「數分鐘」長度的影片。
Imagen 封閉測試
同時 Google CEO 也宣佈 Imagen 模型很快就會進入 AI Test Kitchen (App),提供少數人測試。
AI Test Kitchen 是今年 8 月推出的 App,可讓 Google 釋出給大眾測試它多項 AI 開發專案。AI Test Kitchen 是看使用者怎麼使用、搞出什麼問題,藉此改進 AI 的功能或穩定性。
Google 最早是將 LaMDA (Language Model for Dialogue Applications) 放上 AI Test Kitchen。最新的計畫有 2 項 Imgen 專案。一為 City Dreamer,讓用戶輸入文字描述一段對城市的想像,由 Imagen 幫你生成影片。Wobble 則是讓 Imagen 幫你將怪物的描述文字具體化成高畫質影片。
AI Text Kitchen 目前僅透過 Android 和 iOS 版釋出給英語地區,包括英、美、澳、紐、加拿大及肯亞。
來源:Petapixel