動画生成AI分野で、新興スタートアップが次々と登場し、既存の企業に対する競争圧力が高まっている。中でも高い関心が集まっているのが、大手半導体メーカーのNVIDIA、グーグル、メタの元社員によって設立されたスタートアップ「Hedra」と、元マイクロソフトエンジニアのガウラブ・ミスラ氏が創業したスタートアップ「Captions」だ。

この分野は、OpenAIのSora、Pika、Runway、Lumaなど複数のプレイヤーがひしめき合う激戦状態だが、HedraやCaptionsの参入で競争はさらに激化することが見込まれている。

現在、特に注目度の高いこの2社に焦点を当てて、それぞれがどのような強み・特徴を持っているのかを探ってみたい。

自然なリップシンクができるAIアバターで人気「Hedra」

AIアバターを簡単に作成できるHedra
hedra公式サイトより

シードラウンドでは1,000万ドルの資金調達に成功したHedraの主力モデルは、動画に特化した基盤モデル「Hedra Character-1」で、AIによるデジタルアバターやキャラクター動画が簡単に作れるとして、RedditやInstagramといったSNSで話題を呼んでいる。特に音声に合わせたリップシンクの自然さが売りだ。

手軽さもHedraの魅力のひとつで、無料の試用プランが豊富に提供されており、写真、絵、アクションフィギュアなど、多様な種類の人物画像をアップロードするか、あるいはAIに生成させて、動画の作成を行うことができる。

さらに「スタイル設定」機能を使用することで、キャラクターにさまざまな衣装を着せたり、背景を追加したり、顔をレゴのキャラクターやアニメに変更したりすることもできるようになっており、よりカスタマイズの自由度が高くなっている。

教材や販促ツールなど、Hedraの様々なユースケース

これまで、35万人以上のユーザーがHedra AIを使って160万本以上のビデオを制作しており、Hedraは順調にユーザー数を伸ばしている。様々なコンテンツ作成、ソーシャルメディアや、販促ツールの作成、マーケティングへの活用、教育教材の制作まで、幅広いビジネスシーンでの活用が可能だ。

Hedraの共同設立者兼CEOであるマイケル・リンゲルバッハ氏は、「我々は単なるテキストから動画への変換モデルではなく、YouTube動画やeラーニングコンテンツの制作を自動化する、コミュニケーション周辺の統合ワークフローツールに焦点を当てた」と説明している。

動画生成の速さが売りのHedra

動画生成の速さに強みのあるHedra hedra公式チャンネルより

Hedraは、自社の強みとして、これまでの動画生成AIが苦手としてきた「スピードとコントロールのバランス」を取ることができる点を強調している。

同社によると、これまでクリエイターはAIによる動画生成を行う際、動画の詳細のコントロールと速度のトレードオフに直面してきたが「Character-1」は、速度と使いやすさの両立を叶えることを目指しており、生成時間が1分以内と、競合他社と比較して迅速に生成処理を行うことができる。

今後は、プラットフォームをよりマルチモーダルにすることに注力し、「ストーリー、サウンド、ビデオ生成を1つの統一されたワークフローに統合」できるようにする予定とのことだ。

動画の修正、編集から生成までカバーする「Captions」

動画の編集からAIによる生成までカバーするCaptions
Captions公式サイトより

一方、2021年に設立された「Captions」は、何度かタップするだけで、様々な修正や編集を行い、プロのような動画を作れるスマホアプリとしてスタートした。

その後、同社はAIの活用を本格的に行い、ユーザーがAIアバターを使用した動画をゼロから作成可能なサービスもリリース。主力製品であるiOSアプリに加えて、ウェブおよびデスクトップアプリケーションもラインナップに追加した。

ウェブとデスクトップ版ではiOS版よりも長い、最大30分のビデオがサポートされ、28以上の言語へのAI吹き替え、被写体の目線を修正するAIアイコンタクト、長編動画から短いクリップを抽出するAIショート、バックグラウンドノイズを自動的に除去するAIノイズ除去、AIキャプションや画像、サウンド効果の追加機能を備えている。

簡単な操作で動画の生成からカスタマイズまで行える Captions公式チャンネルより

細かいカスタマイズが可能なCaptionsの動画編集

Captionsの多機能性は数百万人のユーザーの獲得に貢献したが、さらに今年初め、同社は生成AI機能を備えたAI CreatorおよびAI Edit機能を発表し、動画編集から動画生成サービスへと事業を拡大した。

新しく追加された機能には、取り込んだ動画コンテンツに基づいて、AIがカスタムグラフィック、ズーム、音楽、サウンドエフェクト、モーション背景などを追加する機能やユーザーがCaptionsでゼロから動画を生成できる機能などが含まれている。

同社のユーザー数は1,000万人以上に達し、生成される動画数は月間300万本以上となっており、シリーズCラウンドでは6,000万ドルを調達、評価額は5億ドルに達した。

この新たな資金は、機械学習チームの拡大と、社内研究活動および技術インフラへの投資継続に充てる予定とのことだ。

生成AIを活用した動画制作には、OpenAIやGoogleなども参入し、今後も次々と新しいサービスがリリースされることが予想される。フリーランサーから様々なサイズの企業まで、動画コンテンツの作成に多様な選択肢が提供され、制作のスピードとコストの両面で大きな変革が進行している。

今後、より多くの人々が高品質な動画コンテンツを手軽に制作できるようになり、マーケティングや教育、エンターテインメントなどの分野で、AI生成動画の活用が一層広がっていくのではないだろうか。

文:大津陽子
編集:岡徳之(Livit