もう様々なAIサービスが登場して把握できないのだが、Google が2025年5月のGoogle I/Oで発表した次世代動画生成AIモデルのVero 3を発表している。Vero 3は、昨年発表のVeo 2の機能強化最新版で、完全に同期した音声も自動生成できる映像と音声を統合生成することができる。このために、映像だけでなく音声も含めた完全な動画コンテンツを一度に生成できる。通常は別のサービスを利用してきた、映像と口の動きを一致させるリップシンク機能も実現している。
Veo 3は、最大8秒間の動画を720p解像度で生成できる。この動画は16:9の横長フォーマットだ。将来的には4K解像度での出力にも対応予定となっており、さらなる高品質化が期待されている。
さらに、Veo 3は、Veo 3は、テキストプロンプトや静止画から映像を生成できる。売りは、複雑な指示や抽象的なプロンプトをより正確に理解し、映像に反映させることができるとGoogelは言っている。カメラアングルやレンズの種類、撮影手法などの専門的な指示にも対応でき、「タイムラプス」「空撮」「パンショット」「18mmレンズ」「浅い被写界深度」といった映画制作特有の用語を理解して映像に反映する。このあたりは、いつも使っているRunwayと同じだ。
Veo 3の利用には、GoogleのAI Pro(月額2,900円)またはAI Ultra(月額36,400円)プランへの加入が必要だ。だが現時点では、利用者は1日あたり3回までの動画生成制限がある。
利用実績と普及状況
報道によると、Veo 3のリリースから7週間で、GeminiアプリとFlowを通じて4,000万本以上の動画が生成されたそうだ。
面白いのは、吉本興業ホールディングスが先行パートナーとしてVeo 3を活用し、「笑顔」や「微笑み」をテーマにしたショートビデオを制作しているようだ。これは、このようなサービスのマーケティング手法としては面白い試みだ。
もうひとつマーケティングを意識しているのは他社製品との連携だ。Veo 3は、既存のクリエイティブツール(Adobe Premiere ProのプラグインやDescriptなど)との連携も可能であり 、実際の動画制作のワークフローにおいて強力なツールとして企画されている。
例えば、スクリプトをGemini Ultraに入力すると、Geminiがそれを複数のチャプターとシーン遷移に分解する。その後、Veo 3が広告主ブランドに適合するオーディオビジュアルで動画をレンダリングし、YouTubeへの自動公開とSEO最適化されたメタデータ付与、さらにはGoogle Sitesやメールニュースレターへの埋め込みまでを自動化するという使い方だ。これなら、広告主も使いやすいだろう。
他社製品との差別化
ネット上の評判では、OpenAIのSoraと比較して、Veo 3は音声生成能力と物理シミュレーションの精度で優位性を持つようだ。一方、Soraは操作性と編集機能で優れており、それぞれが異なるアプローチだ。Runwayは使っているが、Veo 3は一度だけだし、Soraは一度も経験がないから個人的な評価はできrない。
SynthIDによる電子透かし
Veo 3で生成されたすべての動画には、「Veo」という可視的な透かしと、SynthIDという不可視の電子透かしが埋め込まれている。この技術により、AI生成コンテンツの識別が可能になり、フェイク動画の拡散防止のガードが付いている。
Google Veo 3は、すでに競合の多い映像生成AIの分野で存在感を発揮できるかはまだ未知数だ。Gemini Pro契約者が使えることから、ここに勝機があるのかとも思う。ともかく、少し使ってみよう。