Metaがビデオ生成とサウンドでAI映画界に参入

Metaがビデオ生成とサウンドでAI映画界に参入

トピック — 人工知能

出版

メーガン・クラウスの画像

AI生成動画は来年Instagramでデビュー予定です。Video Genは動画と音声の両方を作成できます。

Metaは、リアルな動画を作成できる基盤モデルを発表しました。これは、新興の生成AI動画コンペティションにおいて、OpenAIのSoraやGoogleのVeoに匹敵するものです。10月4日には、2つの新しいモデルが公開されました。

  • 30B パラメータの Movie Gen Video。
  • 13B パラメータの Movie Gen Audio。

どちらもMetaのLlama 3モデルをベースにしています。このテクノロジー大手は、2025年にMovie GenをInstagramに組み込む予定です。

Movie Gen ファミリーのモデルとは何ですか?

Movie Genモデルは、テキストから動画または音声を生成する生成AIです。Meta社によると、Movie Genは最大16秒の動画を作成できるとのことです。比較対象として、現在一般公開されていないOpenAIのSoraは、複数のシーンを含む1分間の動画を生成できます。一部のクリエイター向けに提供されているVeoは、約1分間の動画を作成できます。

Movie Genは自然言語で操作されます。つまり、ユーザーは見たいシーンを、個々の要素や全体的なトーンを含めて説明することができます。また、自然言語のテキストプロンプトに基づいて、シーンの一部を追加したり削除したりするなど、動画の要素を変更することもできます。

Movie Gen で作成されたビデオの静止画。
Movie Genで作成された動画の静止画。お題の要約は「女の子が凧を持って浜辺を走っています。ジーンズのショートパンツと黄色のTシャツを着ています。太陽が輝いています。」です。画像:Meta

メタ氏によると、パーソナライゼーション機能は「学習後の手順」によって実現されたという。これらの手順により、AIは「テキストプロンプトに従いながら、人物のアイデンティティを維持する」ように調整される。これにより、ユーザーは自分自身、あるいは他の誰かを、カスタムメイドのシーンの中に配置することができる。

自然言語プロンプトを使用してビデオを編集できます。
自然言語プロンプトを使ってビデオを編集できます。画像: Meta

Metaの製品は、当初の発表時点では主にコンテンツクリエイターをターゲットにしているようです。Metaはブログ投稿で、「人々が新しい方法で自己表現できるように支援し、そうでなければ機会を得られなかった人々に機会を提供すること」を目標としています。

参照: デジタル変革は、時には闇雲な試みのように思えるかもしれませんが、プロジェクトを成功させる方法はあります。

光、アクション、そして音

Metaの研究論文によると、Movie Gen Audioは「最長数分」の動画用の音楽や効果音を作成できる。音楽は48kHzで生成され、画面に表示される画像に合わせたり、サウンドトラックとして使用したりできる。

Movie Gen Audio がサウンドトラックとディジェティック サウンドの両方を作成する Meta のデモンストレーションの静止画像。
MetaによるMovie Gen Audioによるサウンドトラックとディジェティックサウンドの作成デモの静止画像。画像:Meta

Metaはセキュリティとディープフェイクの懸念に対処するためにLlama 3を指摘

企業にとって、AIが生成した動画を迅速に生成することで、社内外のコンテンツ制作にかかる時間を大幅に短縮できる可能性があります。一方で、AI生成コンテンツ、特に出典を明記せずに使用すると、視聴者に混乱を招き、信頼を低下させる可能性があります。これは、ホスピタリティ・マーケティング・アンド・マネジメント誌の最近のレポートでも明らかになっています。

おそらく信頼性への懸念に対処するため、MetaはVideo Genの画像に透かしを追加しました。動画の左下隅には、AIを示すためによく使われる透明な「スパークル」グラフィックが表示されています。

セキュリティと、生成AIを用いて不快、有害、あるいは誤解を招くコンテンツを作成することは懸念事項であり、特に企業の評判が危うくなる可能性のあるビジネスユースケースにおいては懸念事項です。Movie Genの発表において、MetaはLlama 3ファミリーを含むAIモデルの保護に関する9月のレポートへのリンクを提供しました。レポートでは、モデルが不適切なコンテンツに対する保護策をどのように備えているか、そして画像には目に見える透かしと目に見えない透かしの両方が含まれることが詳述されています。

記事をシェア

こちらもご覧ください

  • カリフォルニア州知事、AI安全法案を拒否
  • Google Gemini の活用:Workspace 向け AI を実際に体験
  • DellがAIイノベーションを加速するための5つのガイドラインを提示
  • 人工知能:さらに読むべき記事
メーガン・クラウスの画像

ミーガン・クラウス

メーガン・クラウスは、B2Bニュースおよび特集記事の執筆で10年の経験を有し、Manufacturing.netのライター、そして後に編集者として活躍しました。彼女のニュース記事や特集記事は、Military & Aerospace Electronics、Fierce Wireless、TechRepublic、eWeekに掲載されています。また、Security Intelligenceではサイバーセキュリティに関するニュースや特集記事の編集も担当しました。フェアリー・ディキンソン大学で英文学の学位を取得し、クリエイティブライティングを副専攻しました。

Tagged: