テクノロジーについて研究していると毎日のように 新しい言葉に出会う。 Google が最近発表した新機能「Gemini Gems」について記事を読んでいると SLM という言葉に出会った。 LLM(大規模 言語モデル)は、最近では一般的に使われる言葉になったかが、SLM という言葉は今まで聞いたこともない 。これは スモール・ランゲージ・モデル(小規模言語モデル)ということで、 小規模な 生成 AI ということのようだ 。
Gemini Gemsは、ユーザーが特定の目的のためにAIアシスタントをプログラムできる機能だ。技術的にはSLMではないそうだが、カスタマイズ可能な単一目的のAIアプリケーションに重点を置いているため、利用者にとってSLMの活用を準備する上で役立つ可能性があるという。
SLMは大規模言語モデル(LLM)と比較して、以下のような利点がある。
- コスト効率: 少ないトレーニングデータで運用できるため、コストが低い
- 特化した性能: 特定のタスクに対して高い性能を発揮する
- 精度の向上: 一般的なAIシステムよりも正確な出力が可能
具体的な活用事例としては、例えば大型の小売業者が自社ブランドのスタイルに基づいてGemsを訓練し、オンライン製品のカタログ化や説明文の作成といった内部タスクに応用することができる。また、顧客からのGoogleレビューに対応するために別のGemsを設定することも可能。これにより、日常的に大量のレビューに対応できる効率的なサポートが実現する。
LLMとGemsの違い
これまで使用してきたLLMベースのAIシステムは、汎用的な能力を持つ一方で、特定の分野における専門知識が不足しているという問題があった。このため、LLMを使用しても、簡単なタスク(例えば、SNSのコンテンツ作成など)に留まり、複雑なタスクに対しては十分な成果が得られないケースが多かったようだ。一方でGemsは、特定の目的に合わせてプログラムされているため、より精度の高い結果を生み出すことが可能となる。汎用性が低いが、特定の目的に合わせて訓練しておくということのようだ。
OpenAIの「Custom GPTs」も、Googleの「Gemini Gems」と同様にAI技術をカスタマイズして特定の目的に最適化できるツールだ。こちらは、すでに1年ほど前にリリースされて、すでに使われている。どちらも、ユーザーがAIを単一タスクに集中させたり、特定の目的に最適化するために設計されているが、そのアプローチや機能にはいくつかの相違点がある。調べてみると下記のようなことだ。
データ保持能力
- Gemini Gems: 1セッションで最大70万語のデータを保持できる
- GPTs: Gemsと比較して、保持できるデータ量が少ない。
ファイルアップロード機能
- Gemini Gems: クライアントデータやブランドスタイルガイドなどのファイルをアップロード可能
- GPTs: ファイルアップロード機能が限定的。
自動最適化
- Gemini Gems: 生成したコンテンツを自動的に評価し、改善する機能がある
- GPTs: このような自動最適化機能は明確ではない。
共有機能
- Gemini Gems: 現時点では共有機能がない
- GPTs: ユーザー間で共有可能。一般にも解放できるために、GTPs Storeもあり、他のユーザーが作ったGTPsを利用できる。
これらの違いにより、Gemini Gemsはより大量のデータを扱え、ファイルアップロードや自動最適化機能やシンプルかつ効率的なカスタマイズを求める場合に適している。一方で、GPTsは共有機能で一般への開放(あるいは販売も)や、高度なカスタマイズや外部ツールとの連携が必要な場合に適しているようだ。
GPTsは、登場した1年ほど前に、面白半分で、いくつか使ってみたが、私のような使い方では、何かに特化するわけではないので、結局は汎用モデルしか使っていない。やはり、どちらも特定の業務や目的があって使うものなのだろう。