生成AIと著作権

by Shogo

生成AIの普及が進むにつれ、著作権問題がますます深刻化している。非常に優秀と評価の高い「Claude」のサービスを運営するAIスタートアップAnthropicが、著作権侵害を理由にカリフォルニア州で訴訟を起こされたことが報じられた。この訴訟は、AI技術の発展と著作権保護の衝突を象徴するものの最新の事例と言える。

2024年8月、作家のアンドレア・バーツ、チャールズ・グレーバー、カーク・ウォレス・ジョンソンがAnthropicを訴えた。彼らの主張によると、Anthropicは違法に入手した著作権で保護された作品を用いて、自社の大規模言語モデル「Claude」を構築したというのだ。具体的には、違法なウェブサイトからダウンロードされた彼らの作品が無断でコピーされ、AIモデルの訓練データとして使用されたとされている。

さらに、昨年にはUniversal Musicなどのレコード会社もAnthropicを提訴している。この訴訟では、レコード会社が保有するアーティストの楽曲が無断でAIモデルに使用され、その結果、ほぼ同一の歌詞が生成されたと主張されている。

これらのケースが示すのは、「インターネット上に存在する著作物は、たとえアクセスが容易であっても自由に利用できるわけではない」という基本的な著作権の原則だ。あえて書くほどのこともないような当たり前のことだ。しかし、AI開発企業がこの原則を遵守していないという批判が高まっている。

他のAI企業も著作権問題で訴訟を起こされている。その数は多いが、覚えているものだけをリスト化すと以下のような状況だ。

ChatGPTで先行したOpenAIとMicrosoftも、著作権侵害の訴訟に直面している。非営利の調査報道機関「Center for Investigative Reporting」が、著作権侵害の訴訟を提起した。具体的には、AIモデルが無断で著作物を使用して訓練されたと主張している。また、ノンフィクション作家のニコラス・バスバンズとニコラス・ゲージも、同様の理由で訴訟を起こしている。

NYTも、OpenAIとMicrosofが自社の記事を許可なくAIの学習に使用し、著作権を侵害していると主張している。具体的には、ChatGPTなどの生成AIがNYTの過去記事をベースに訓練されたため、NYTの収入源が損なわれると指摘している。NYTは、無断で収集したコンテンツを使った言語モデルや訓練データの破棄を要求し、損害賠償も求めている。具体的な損害額は明記されていないが、数十億ドルに上ると試算されているようだ。

また、全米の地方新聞8紙もOpenAIとMicrosoftを著作権侵害で訴えている。これらの新聞社も、AIの学習に自社の記事が無断で使用されたと主張している。

このような状況を受けて、学習データの利用について契約するケースも増えてきた。OpenAIは、The New Yorker、Vogue、Wiredなどの出版社であるCondé Nastと契約を結び、同社の著作物を学習データとして利用する。勝手に学習に利用するのでなく、事前許可を撮るということだ。このような契約が今後増えると予想される。

生成AIと著作権については、整理すると学習データの使用許可と生成AIの出力物との類似性が問題になる。

生成AIの学習に使用するデータが著作権で保護されている場合、適切な許諾を得る必要があるのは当然だ。無断で著作物を使用することは著作権侵害とみなされる。多くのAI企業がこれを無視してきたようだ。それがが、いくつかの訴訟に事例となり、OpenAIとCondé Nastとの学習データに関する契約は、そのような訴訟を避けるためのものだ。

そして、もうひとつは独自創作の確認だ。生成物が、生成AIが学習に使用した著作物の表現と類似していないことを確認する必要がある。AI自体が学習対象の著作物をそのまま出力するような状態になっていないことを保証することが、著作権保護の前提となる。これについては、類似性の判定は難しいので、裁判を通じて行うというケースが出てくるものと思われる。

生成AIスタートアップの数が増えているが、この2点の著作権保護を遵守しないと産業そのものが、成立しなくなる。学習をともなって、独自のアウトプットを生成することが、前提だからだ。

You may also like

Leave a Comment

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

error: Content is protected !!