Meta近日發布了Meta Movie Gen,這是一款利用人工智能(AI)生成長達16秒的16fps視頻的新工具。
該工具使用文字提示創建帶有同步的AI生成音頻的視頻片段。據該公司稱,Movie Gen可以使用一張照片生成個性化的AI視頻。
Meta表示,該工具在公開發布之前仍在測試中。
Movie Gen有4個功能:視頻生成、個性化視頻生成、精確視頻編輯和音頻生成。
Meta表示,Movie Gen的編輯轉化可以進行局部編輯,如添加、刪除或替換元素,以及全局修改,如背景或風格修改。“與要求專業技能或缺乏精度的生成工具不同,Movie Gen保留了原始內容,只針對相關像素。”
對于音頻,Meta訓練了一個13B參數音頻生成模型,該模型可以接收視頻和可選文字提示,并生成長達45秒的音頻,包括環境聲音、音效和器樂曲背景音樂——所有這些都與視頻內容同步。

來自使用文字輸入概要創建的Meta視頻截圖