Perplexityの大問題

by Shogo

AIのハルシネーションを避けるためには、RAG機能(Retrieval-Augmented Generation:検索拡張生成)を搭載したAIチャットボットが良いと書いたばかりだ。RAG機能が搭載されていれば、LLM(大規模言語モデル)が回答を生成する際に検索を組み合わせて、確実な知識や情報源を参照するために精度が高くなるからだ。その代表例が、Perplexityだ。

Perplexityは、ジェフ・ベゾスやNvideaなどに支援されたAIサービスだ。すでに企業価値は10億ドルを超えている。Perplexityの特長は、LLMと検索が組み合わさったことだ。有料版では、GPT-4o、Claude 3、Mistral Large、Llama 3とPerplexity独自LLMモデルを選択して使える。最近、ソフトバンクが自社端末に1年間無料をつけたので日本でも話題になりつつある。

人気が出始めたPerplexityだが、悪い評判が立っている。6月にForbesとWiredが調査して報道した記事によると、Perplexityの疑わしいデータ収集方法が明らかになった。Perplexityは、検索ボットを排除するために設計されたウェブ標準であるRobots Exclusion Protocolを回避したとして非難されている。これにより、Perplexityはコンテンツ盗用の疑いをかけられ、ForbesはPerplexityが、自社の記事を盗用したと直接非難している。

さらに問題になっているのは、Perplexityが未公開のIPアドレスを使用して、クローラーをブロックしているウェブサイトからデータをスクレイピングしている可能性が高いということだ。Wiredの報道によれば、Wiredの発行元であるCondé Nastの未公開のIPアドレスに不正アクセスを数千回記録しているとのことだ。ウェブサイト所有者の意向を無視するこの行為は、Perplexityの運営に関する重大な倫理的問題を提起している。つまり、10億ドル企業にも関わらず、ネット上の無法者ということになる。

さらに、データスクレイピング以外にも、Perplexityは正確性についても批判を受けている。Perplexityは、間違った情報を生成したり、発言していない人物に発言を帰属させたりすることが判明した。これでは、ハルシネーションを起こす、他の生成AIチャットボットと同じだ。RAG機能は、どこに行ったと問いたい気分だ。

データスクレイピングは、一部のや地域では合法であり、完全に法律に触れるわけではない。しかし、倫理的な影響は否定できない。ウェブサイトの制限を回避し、コンテンツを盗用する行為は、あってはならないことだ。

この問題については、主要な出資者であり、Perplexityが使っているAWSの運営者のAmazonの創業者のジェフ・ベゾスが調査を開始したという報道もある。

無料版ではあるが、頻繁に使っているPerplexityが、正確性にも疑問符がつき、その無法行為や倫理観のなさから、今後も順調に成長を続けられるかは不透明となってしまったと言わざるを得ない。ただでさえ、AI技術には安全性の問題がつきまとっているところに、今回のPerplexityの問題は、AI技術の発展に大きな波紋を広げそうだ。

You may also like

Leave a Comment

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

error: Content is protected !!