Google 開發 AI 影像產生技術好一陣子之後,上周 Google CEO Sundar Pichai 終於公佈了該公司正在開發中的影片產生器模型 Phenaki 。
![]()
Google 有二種文字轉影片的 AI 產製工具,第一個是 Imagen,能讓用戶輸入文字以產生影片。而 Phenaki 則可以文字產生較長的影片。這意謂著 AI 文字轉影片生成工具可由營運者來「導演」。
Pichai 在其推特頁面展示了 Phenaki 的影片,這是該公司第一次分享 Phenaki 根據文字提示產生較長、敍事有條理的超高解析度影片,或是利用 Imagen Video 工具來提升影片畫質。
1/ From today’s AI@ event: we announced our Imagen text-to-image model is coming soon to AI Test Kitchen. And for the 1st time, we shared an AI-generated super-resolution video using Phenaki to generate long, coherent videos from text prompts and Imagen Video to increase quality. pic.twitter.com/WofU5J5eZV
— Sundar Pichai (@sundarpichai) November 2, 2022
Phenaki 和 Imagen Video 模型差別在於它是將多段影片片段合成,而使之有不同場景。這類似電影分鏡表,導演可以一幕一幕計畫,只是電影是攝影機拍的,而 AI 影片,是 AI 模型生成的。 Imagen 只能產生幾秒鐘影片,但 Google 說,Phenaki 可以產生「數分鐘」長度的影片。
Imagen 封閉測試
同時 Google CEO 也宣佈 Imagen 模型很快就會進入 AI Test Kitchen (App),提供少數人測試。
AI Test Kitchen 是今年 8 月推出的 App,可讓 Google 釋出給大眾測試它多項 AI 開發專案。 AI Test Kitchen 是看使用者怎麼使用、搞出什麼問題,藉此改進 AI 的功能或穩定性。
Google 最早是將 LaMDA (Language Model for Dialogue Applications) 放上 AI Test Kitchen 。最新的計畫有 2 項 Imgen 專案。一為 City Dreamer,讓用戶輸入文字描述一段對城市的想像,由 Imagen 幫你生成影片。 Wobble 則是讓 Imagen 幫你將怪物的描述文字具體化成高畫質影片。
AI Text Kitchen 目前僅透過 Android 和 iOS 版釋出給英語地區,包括英、美、澳、紐、加拿大及肯亞。
來源:Petapixel
