AI学習データの著作権問題

by Shogo

AI技術の進化に伴い、AI学習用データの著作権問題が焦点になってきている。大規模言語モデル(LLM)の開発に必要なデータセットの収集と利用について、著作権者の許可を得ずに著作物を使用することについて訴訟も頻発している。

そんな中で画期的な米国連邦裁判所の判決が出た。Anthropic社がClaude大規模言語モデルの訓練において、作家Andrea Bartz、Charles Graeber、Kirk Wallace Johnsonの書籍を使用したことについて「フェアユース」を認められたのだ。

しかし、同時に同社が700万冊以上の海賊版書籍をライブラリにコピー・保存したことは著作権侵害に当たると判断し、12月に損害賠償額を決定する裁判が予定されている。米国著作権法では、故意の著作権侵害に対して作品1件につき最大15万ドルの法定損害賠償が認められており、Anthropic社は巨額の賠償責任を負う可能性がある。

今回のLLM学習データの利用について、フェアユースの判決が出たことは、現在進行中の他の裁判にも影響するだろう。

BBC対Perplexity

BBCは2024年6月、AI検索エンジンPerplexityに対して法的措置を警告した。BBCは、Perplexityが同社のコンテンツを無断でスクレイピングし、逐語的に複製していると主張している。特に注目すべきは、BBCの内部調査により、Perplexityの回答の17%に重大な不正確性や文脈の欠如があることが判明していることだ。これは、Perplexityを盲信して使用している身にはかなり衝撃だ。

BBCはPerplexityに対し、コンテンツのスクレイピング停止、既存データの削除、そして金銭的補償を要求しており、これはBBCがAI企業に対して法的措置を取る初の事例となっている。

OpenAIの訴訟状況

OpenAIは複数の著作権訴訟に直面しているが、2024年11月にRaw Story社とAlternet社による訴訟で勝訴した。ニューヨーク南部地区裁判所は、原告が具体的かつ実際の損害を証明できなかったとして訴訟を却下しました。

一方で、作家のマイケル・シェイボン、タ・ネヒシ・コーツ、サラ・シルバーマンらによる集団訴訟や、ニューヨーク・タイムズとの訴訟は継続中だ。

日本の著作権法

有力なLLMサービスも存在しないこともあるが、同様の訴訟は起きていない。それは、2018年の著作権法改正により導入された第30条の4で、AIの学習データとしての著作物利用を広く許容していることも理由だ。同条は情報解析目的であれば、営利・非営利を問わず、著作権者の許諾なく著作物を複製できると規定している。これは、英国やドイツなどの類似規定が非営利目的に限定されているのとは大きく異なる。

ただし、重要な点として、第30条の4は「学習」を適法としているが、生成については制限がある。例えば、ポケモンのピカチュウの画像をAIに学習させることは適法だが、AIがピカチュウそっくりのコンテンツを生成すれば著作権侵害に当たる可能性がある。

AI学習データの著作権問題は、技術革新とクリエイターの権利保護という相反する要求の間でバランスを取る複雑な課題だ。OpenAI社、Anthropic社やPerplexity社の事例に見られるように、海外では訴訟が頻発し、法的不確実性が高まっている。今回のAnthropic社にフェアユースを認めたことは、今度の法判断に影響するだろう。

You may also like

Leave a Comment

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

error: Content is protected !!