Claude 3.5 Sonnet発表

by Shogo

Anthropicが、新しい生成AIモデル「Claude 3.5 Sonnet」を発表した。このモデルは、「最高クラス」とネット上では評判になっている。Claude 3.5 Sonnetは、同社の前モデルであるClaude 3 SonnetおよびClaude 3 Opusを上回る性能を持ち、読み取り、数学、ビジョン、コーディングのベンチマークで優れた成績を収めているそうだ。先ほど一応テストしてみたが、簡単な質問では違いがわからない。

紹介されている記事を読むと、新しいClaude 3.5 Sonnetは、テキスト生成だけでなく、画像とテキストの分析も可能だ。さらに、前モデルのClaude 3 Opusに比べて2倍の速度があるという。

また、画像分析機能においても向上しており、グラフやチャート、インフォグラフィックからのデータをより正確に解釈し、視覚的なアーティファクトや歪みのある画像のテキストを転写する能力も向上しているそうだ。Anthropicによると、内部のエージェンティックコーディング評価では64%の問題を解決し、Claude 3 Opusの38%を大きく上回る結果を出している。これが、本当ならすごい。Opusは有料だが、Sonnetは無料だからだ。

特に重要なのは、顧客データを使用しないトレーニングを行っていることだ。Anthropicはこれまでユーザー提出データを使用せずにモデルをトレーニングしてきた。これはユーザーの明示的な許可なしに生成モデルをトレーニングしないという方針によるものだそうだ。これも本当ならプライバシーや安全性という面では安心だ。

今回の発表で、今までのチャット型AIにない新機能「Artifacts」が追加された。「Artifacts」は、ユーザーがSonnetにテキストやコードスニペットなどのコンテンツを生成するよう依頼すると、チャットの横に作成されたArtifactsのウィンドウが表示され、ユーザーが生成されたコンテンツを閲覧・編集できるようになる。これは、画期的かもしれない。使い勝手が大きく変わるだろう。

報道やAnthropicの発表を整理すると、Claude 3.5 Sonnetには他のAIモデルと比べていくつかの優位性があるようだ。

まず、ベンチマークテストでの高いパフォーマンスだ。Anthropic社の発表によると、Claude 3.5 SonnetはGPT-4oやGemini 1.5 Proなどの競合モデルを、大学院レベルの推論能力(GPQA)、学部レベルの知識(MMLU)、コーディング能力(HumanEval)など、幅広い評価項目で上回っている。お金の話になるが、GPT-4oやGemini 1.5 Proは有料モデルだ。

第二に、高速処理と低コストを両立している点です。Claude 3.5 Sonnetは前モデルのClaude 3 Opusの2倍の速度で動作しながら、価格はClaude 3 Sonnetと同等の低価格に抑えられている。高度な顧客サポートや複数ステップのワークフロー管理など、複雑なタスクに最適なコストパフォーマンスを実現する。

第三に、画像機能の大幅な強化だ。グラフやチャートの解釈、不完全な画像からのテキスト抽出など、ビジュアルデータの分析においてClaude 3 Opusを上回る性能を示しています。小売、物流、金融サービスなど、画像に多くの情報が含まれる業界での活用されるのだろう。

第四に、自然な会話や創造性の高さだそうだ。ユーモアや複雑な指示の理解力が向上し、人間らしい自然な口調で高品質なコンテンツを生成できるようになったという。創作やコミュニケーションの場面で使われるだろう。

そして、「Artifacts」だ。この機能により、ユーザーとの協調作業がしやすくなった点が挙げられる。コードスニペットやWebデザインなどをリアルタイムに表示・編集できるようになり、単なる会話AIから生産性ツールへと進化を遂げていると評価されている。

Claude 3.5 Sonnetは性能、コスト、機能面で他のAIモデルに勝る優位性を、現時点で持っていると言える。しばらくは、Claude 3.5 Sonnetをメインで使ってみようかと考えている。

You may also like

Leave a Comment

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

error: Content is protected !!