AIが多くのことを根本的に変え始めている。iPhoneの登場が世界を変えたことと同じことが、AIで起こり始めている。
YouTubeが新たにテストを始めた「AIリップシンク機能」も、その一つだ。発表されたこの機能は、コンテンツの常識を大きく塗り替えるだろう。これは、AIによる自動吹き替え(オートダビング)機能に加え、話者の口の動きを翻訳後の音声に合わせて自然に再構成するというものだ。英語を話さないクリエイターが、英語圏の視聴者に向けて、自分の口で流暢に話す。そんな光景が、実現する時代が近づいている。
従来の自動翻訳や字幕では、音声や文字での補助にとどまり、映像とのズレが避けられなかった。今回のAIリップシンクでは、YouTubeが開発した独自のアルゴリズムが、顔の動きや唇・歯の位置、表情をピクセル単位で解析し、翻訳後の音声と完全に同期するように映像を再生成するという。
現在は英語・フランス語・ドイツ語・スペイン語・ポルトガル語に対応しており、今後20以上の言語へ拡大予定だという。多分、日本語も含まれるだろう。すでにAI自動吹き替え機能は6000万本以上の動画で使われており、このリップシンク機能が組み合わされれば、世界中のクリエイターが世界の視聴者を相手にできることになる。
マーケティングの観点から見れば、これはコンテンツの国境を消し去る技術だ。
例えば、スペインの美容系YouTuberが、日本語音声でリップシンクした動画を投稿すれば、日本のファンが違和感なく彼女のトークを楽しめる。あるいは、インドの教育チャンネルが英語・フランス語で同時展開し、ヨーロッパ市場を自然に開拓できる。
これまで多言語展開には、吹き替えコストや字幕制作、声優の起用といった多額のローカライズ費用が必要だった。だがYouTubeのAI自動翻訳+リップシンクが実用化すれば、クリエイターも企業も動画一本で世界市場にアクセスできるようになる。
広告主にとっては、これまで翻訳の壁で断絶していた新興国市場やニッチな文化圏へ、より低コストで参入できるチャンスが広がる。特定言語のバージョンを大量に制作する必要がなくなり、グローバルキャンペーンを短期間で同時展開できる可能性が出てくる。YouTubeそのものが自動的に世界市場を生成するメディアへと進化するからだ。言葉はあったが、現実的には難しかったグローバル・マーケティングがいよいよ実現するだろう。
だが、課題もある。AIによるリップシンクは、どこまでが本物かという倫理的な問題を含む。YouTubeは動画説明欄に、「この映像と音声はAIにより生成または改変されています」と明記する方針を示しているが、視聴者の心理的な違和感がどの程度なのか、世界の視聴者に受け入れられるかは、まだ分からない。
また、ローカライズが容易になることで、逆に文化的な違いが見えにくくなるリスクもある。マーケティング的には、単に言葉を翻訳するのではなく、文化や文脈を意味として翻訳する力がより問われる時代に入るだろう。
マーシャル・マクルーハンは、かつて「メディアが世界をひとつの村にする」と述べた。半世紀前のこの予言は、AIが映像と音声を統合することで、いよいよ現実のものとなりつつある。YouTubeのAIリップシンクは、多くのコンテンツ・クリエイターが母語のまま世界と会話できる「地球規模の対話空間」を生み出す装置であり、企業にとっては、グローバル・マーケティングの舞台である。いよいよ、村が生まれる。