Metaも大規模言語モデル公開

by Shogo

ChatGPTで大規模言語モデルへの関心が高まり、この状況に慌てたのか、Metaも新しいモデルを公開した。このメタの新しいモデルは、LLaMA だ。「ラーマ」と読むのだろうか、Large Language Model Meta AIの略だそうだ。そのままのところが、面白い。名前をつけるのは、前回のGalacticaで懲りたのだろうか。

LLaMAの特長は、大規模なインフラがなくても、利用できるところだ。しかも、パラメータ数がはるかに少ない上に4つのサイズで利用が可能だと言う。7B、13B、33B、65B の4サイズある。Bはbillionだろうか。

オープンAIのChatGPTのエンジン、GPT-3も研究者に公開されているが、これを利用するためには、スーパーコンピューターのようなインフラを必要とする。MetaのLLaMAは研究者がはるかに利用しやすいそうだ。しかも、パラメータ数少ない13Bモデルであっても、ベンチマークテストでGPT-3よりも性能が上と言うから、より大規模な33B、65Bでは、とてつもない性能ということになる。

メタは2022年11月に、Galacticaと言うAIモデルを研究者向けに公開したが、偏った情報や不正確な情報を回答するとして、研究者が指摘した結果、数日でサービスを中止した。この時と、今回のモデルは、どれほど改善されているか分からないが、ここで恥をかくようなことがないと分かって発表しているはずだから、期待できるのだろう。

Metaは以前よりAIを研究していることで知られていた。大規模な投資を行い、一流の研究者をスカウトしてAIモデルを開発していやはずだが、Galacticaのつまずきで印象的にはGoogleやMicrosoftに比べて出遅れてしまった。LLaMAが今後どのような評価を受けるのかによってMetaのAI分野での評判が確定する。

LLaMAは、現時点では研究者に公開されているだけで、一般の利用はできない。応募しようとしたが、AI分野での発表論文の入力が必要なために応募できなかった。近い将来、一般公開がされたときに試してみるつもりだ。

ChatGPTが公開され話題になり、個人的にもGoogleで検索をせずに、AIのチャットをすることが増えた。使用しているのは、ChatGPT、Bingのチャット機能とPerplexityの3つのサービスだ。同じことを聞いて試していないので、厳密な評価ではないが、どのサービスでも満足の結果が得られている。唯一の違いは、Perplexityが英語にしか対応していないくらいだ。

これだけ話題になっていることで、今後ますます検索はAIのチャットボットになってゆく。そこに、FacebookやInstagramで多くのユーザがいるMetaがLLaMAを公開すると、ますます通常の検索は減ってゆくと予想される。検索で地位を築いたGoogleもどうなるか分からない。

You may also like

Leave a Comment

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください