Googleは来週に予定されていたGeminiの発表イベントを中止して、1月に行うことを決めたようだ。Googleは既にGeminiと言う名称で、次世代のマルチモーダルモデルの大規模言語人工知能モデルを開発されていると発表していた。今回のイベントで、その詳細な内容が明らかになると期待されていたが、答えは1月まで持たなければいけないようだ。
もう少し情報が欲しいので、Google BardにGeminiのことを聞いてみると、以下のような回答を得た。
Google Geminiとは、Google AIが開発した大規模言語モデル(LLM)のセットです。マルチモーダルLLMであり、テキスト、コード、画像を処理および生成することができます。Geminiはまだ開発中ですが、すでに次のタスクを実行できることが示されています。
詩、コード、スクリプト、楽曲、メール、手紙など、さまざまなクリエイティブなテキスト形式を生成します。
高精度かつ流暢に、言語を翻訳します。
オープンエンド、挑戦的、または奇妙であっても、有益な方法で質問に答えます。
指示に従い、慎重に要求を完了します。
Geminiは、次のGoogle製品やサービスで使用されることが期待されています。
検索:Geminiは、検索結果の関連性と精度を向上させるために使用できます。
アシスタント:Geminiは、Googleアシスタントが自然言語クエリを理解して応答する能力を向上させるために使用できます。
翻訳:Geminiは、Google翻訳の精度と流暢さを向上させるために使用できます。
Docs:Geminiは、ユーザーがより簡潔で効果的なドキュメントを書くのに役立ちます。
スライド:Geminiは、ユーザーがより魅力的で有益なプレゼンテーションを作成するのに役立ちます。
Google Geminiは、コンピューターとのやり取りを革命化する可能性を秘めた強力な新しいツールです。まだ開発中ですが、AI分野で大きな力となる可能性があることはすでに明らかです。
具体的な分析と批評としては、次の点が挙げられます。
**Geminiは、テキスト、コード、画像の処理と生成を同時に行うことができるマルチモーダルLLMであるという点で、従来のLLMとは大きく異なります。**これにより、Geminiは、テキストの生成、翻訳、自然言語処理などのタスクを、より効率的かつ効果的に実行できるようになります。
**Geminiは、まだ開発中ですが、すでにさまざまなタスクを実行できることが示されています。**今後さらに開発が進めば、Geminiは、私たちの生活をより便利で豊かにするさまざまなアプリケーションに活用されるようになるでしょう。
Google Bardの回答
Geminiは今までのAIモデルより、人間のように回答する能力があると言われてきた。しかし、これを読む限り、Googleのサービスをを動かすAIエンジンのようで、Bardのように前面に立ってサービスを行うモデルではないようだ。さらに、不思議なのは、この回答の中にBardについて含まれていないことだ。BardとGeminiは両立しないものなのだろうか。今後、情報が出てきて、もう少し詳しいことがイベント前にもわかるかもしれない。
AIツール関連の話題で、最近知人から面白いサービスを教えてもらった。ChatHubと言うChromeの拡張機能だ。これは、名前のとおり多くのサービスのハブになるものだ。たくさんの言語生成AIサービスを同時に利用できる。無料でも利用できるが、35ドル払うと、1度に4つとか6つのAIサービスに同時に質問することができる。対象はChatGPT、Bing、Claude、Bardなど16のサービスをカバーしている。私などはその16のうち、名前だけ知っているものは6つしかなかった。
ChatHub対象サービス
- ChatGPT
- Bing
- Bard
- Claude
- Llama 2
- Perplexity
- Vicuna
- Falcon
- Mistral
- Pi
- WizardLM
- ChatGLM2
- iFlytek Spark
- Qianwen
- Baichuan
- Yi-Chat
名前を聞いたこともないサービスばかりだ。これが、1年前にChatGPTが公開された後で起こったAIブームの威力なのだろう。
試しに35ドル払って、ChatGPT、Bing、Claude、Bardの4サービスを同時に動かしてみると、回答の質は別にして、Bardは圧倒的に早い。これに対して、ChatGPTの遅さが目立つ。ChatGPTは当然のことながら、無料版のGTP- 3.5なので遅いのかもしれない。
このような機能拡張がChromeに入ったりして、ますます言語生成AIは一般化してきた。しかしながら、時々使ってみると、その回答に頭をかしげることも多く、結局は自分で検索したりして考えることになる。遊びで使ってみるには面白いが、内容が厳密でなければいけない時には使用をためらうというのが、言語生成AIの現在の状況なのかもしれない。来月Geminiが公開されて、それがGoogleのAIサービスにどのように反映されるのか早く見てみたい。それにしても、Geminiという名称の由来はなんだろうか。エンジンに2つの極があり、同時に動くということなのだろうか。