ChatGPTが公開されたのが、2022年11月30日だった。まだ1年とは思えないほど、生成AIツールのブームがやってきた。画像生成ツールのMidjourneyは、それ以前から使っていた。だが、AIが人間のような自然な文書を書けるとは夢にも思っていなかった。
知らないところで、自然言語生成AIの技術革新が行われていたようで、ChatGPTの公開後に多くの文章作成ツールが登場した。生成AIが実現したイノベーションは、大量の言語データから統計的に文章のパターンを学習する。ユーザーの指示に基づいて、適切な単語の選択や文章構成を、大量のデータベースから生成できる。考えてみれば、これは、子供が言葉を覚えるのと同じだ。子供は、誰かが使った言葉や文章を思い出して、その場の状況に合わせて再構成して使う。
これを実現しているのは、ディープラーニングだそうだ。単にデータを分析する従来型のAIと異なり、進化したAIは、新規コンテンツを「創造」することができるようになった。この技術の根底には、機械学習やニューラルネットワークがあり、ディープラーニングがある。その応用範囲は無限で、アートからプログラミング、教育まで、さまざまな分野で活用されるようになった。OpenAIのGPT-4やGoogleのPaLM 2、MetaのLlama 2などの進歩は、生成AIの大きな可能性を示している。
ChatGPTが1年前に大ブームになった後で、ChatGPTに対抗する形でGoogleや多くのベンチャーが自然言語AI開発に乗り出し、実際のサービスを開始した。Microsoftは、ChatGPT開発元のOpenAIへの追加投資を行い、自社サービスに生成AIツールを組み込んだCo-pilotを公開して、大きくAI分野に舵を切った。
言語生成だけでなく、さまざまな分野のAIツールが公開されて百花繚乱という状況だ。すでに、画像生成AI、文章生成AI、動画生成AI、音声生成AI、音楽生成AIが一般的に使われ、その能力は日々進化している。
今やクリエイティビティの促進、各種コンテンツの創造、業務の効率化やコスト削減を目的として使用されるようになった。たとえば、アート、各種コンテンツ、コンピュータコードの生成に使われ、多くの業務の効率化が始まった。
ただし、多くの問題が残されている。大きくは、著作権の問題、データセキュリティ、倫理的な懸念などど。特に著作権の問題については、AIが学習する茶作物をめぐる訴訟も起こっている。今後、技術開発者、利用者、法律家などが協力し、新しいルールを作り上げる必要がある。しかし、最大の問題は、AIが自分で自分を改良し続けるというリスクだ。これが、起これば「ターミネーター」の世界につながる。
生成AIは、私たちの仕事や日常生活に革新をもたらす可能性を秘めているが、一方で、まだ過渡期であり、生成AIには誤った情報生成や倫理面での課題など、いくつかの懸念点ある。特に言語生成AIツールで生成されたデータに客観性や一貫性に欠けるケースも多く、出力結果を確認することが、かえって面倒だというのが個人的な実感だ。この点では、画像生成AIツールは安心だから、今はほとんどMidjouneyしか使っていない。