ByteDanceの「X-Portrait 2」

by Shogo

AI技術の進化は目覚ましく、多少のことでは驚かなくなったが、ByteDanceが開発した「X-Portrait 2」には驚かされる。動画生成のリップシンクツールは珍しいものではないが、X-Portrait 2は口の動きだけではなく、自然な表情まで表現している。

X-Portrait 2は、AI技術を用いて静止画をまるで生きているかのような動画に変換するシステムだ。単に画像を動かすだけでなく、表情や感情のニュアンスまで表現することができ、実写映像と見分けがつかないほどのクオリティを実現している。

X-Portrait 2の最大の特徴は、TikTokが保有する膨大な動画データによる学習が大きく貢献しているのだそうだ。10億人以上のユーザーが投稿する多様な表情、動き、感情を学習することで、X-Portrait 2は人間の顔の自然な動きや複雑な表情を捉え、高精度に再現することを可能にしている。

公開されたX-Portrait 2のデモでは、「シャイニング」、「フェイス/オフ」、「フェンス」といったハリウッド映画の象徴的なシーンを静止画で再現している。登場人物の表情や感情が、まるで役者が演じているかのように生き生きと表現される。

従来のAIアニメーションツールは、顔の特定のポイントを追跡することで表情を生成した。しかし、X-Portrait 2は顔全体の動きを捉え、学習することで、より自然で滑らかな表情の変化を実現するのだそうだ。これにより、速い会話や様々な角度からの視点でも、違和感のない動画を生成することが可能になっている。

X-Portrait 2は、実用化が進めば、エンターテイメント分野に大きな変革をもたらすだろう。映画やゲーム、VR/ARコンテンツなど、様々な分野で活用することで、よりリアルな映像が簡単に生成できる。

過去の俳優を現代によみがえらせたり、CGキャラクターにリアルな表情を与えることで、より表現力豊かな作品を生み出すこともできるし、ゲームではプレイヤーの表情をアバターに反映させることで、より感情移入しやすいゲームを提供することもできる。

これほどリアルなものが作れると、悪用される可能性も懸念される。特に、実写と見分けがつかない動画を簡単に生成できることから、偽情報やなりすましによる被害がでることは予想に難くない。だから、ByteDanceは、これらの懸念に対処するため、X-Portrait 2のコードを非公開にするなど、対策を講じているのだそうだ。

X-Portrait 2の開発は、ByteDanceのAI分野における積極的な投資と研究開発の成果なのだろう。何しろ資金はTikTokの普及のおかげで豊富だ。資金だけでなく、TikTokで培った膨大なデータとAI技術を基盤に、様々な技術の開発をおこなっているようだ。すでに、中国国内だけでなく、ヨーロッパや東南アジアにも研究拠点を設立し、グローバルなAI戦略を展開している。しかし、欧米諸国ではTikTokの利用制限など、規制の動きも出ており、今後の動向が注目だ。

中国では、BATと呼ばれる、検索エンジンサービスを提供する「バイドゥ(百度、Baidu)」、ECサイトを運営する「アリババ(阿里巴巴集団、Alibaba)」、メッセンジャーアプリやゲームで有名な「テンセント(騰訊、Tencent)のハイテク企業が有名だが、ここにByteDanceが食い込んでくるのだろう。何と呼んだら呼んだらよいか考えてみた。BABTだろうか。ネットで検索してみると、boric-acid batching tank(ホウ酸補給タンク)やbehind armor blunt trauma、これは兵士がボディーのプロテクターをつけていても、衝撃で受けるケガのようだ。まだ、BABTと決まっていないから余計な手間だった。

You may also like

Leave a Comment

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

error: Content is protected !!