生成AIは急速に進歩し、既存の著作物を学習データとして取り込む手法が広く使われています。しかし、それは「無断利用=権利侵害ではないか」という疑問を免れません。本稿では、主に米国の AI 企業(OpenAI、Google、Perplexity など)を対象に、「AIによる学習」と「著作物の権利」の関係を考察します。特に、RAG(検索拡張型生成 AI)がもたらす新しい情報取得の流れ、報道機関が学習データとして使われた争い、米国訴訟例、さらには日本での公取委報告書などを参照し、実務・法制度視点から論点を整理します。生成AIの発展と共に、表現者・読者・開発者すべてにとっての「公正」が何かを問い直す場となれば幸いです。
生成AIは急激に進歩しあらゆる著作物を学習しています。本記事は学習される側の「権利侵害ではないか!!」
という声を考えてみます。確かに「ただ乗りかい!」とも思える点があるでしょう?対象は米国パープレキシティー社。他にも米国グーグルや米国OpenAI社が有名どころですね。これから発展していくのは検索と生成AIを組み合わせたRAG(検索拡張生成)です。個別のユーザーからの問いかけに対してAIが質問の意図を今まで以上に深く理解してネット上の情報を収集、要約、回答する仕組みです。深い理解のために社内のデータベースをのぞいたり、独自に強化したデータベースを整えていったりします。そこがRAGの凄いところ。
グーグル社が提供するGeminiは月間4億5千万人の利用があります。SNSを運営する米国メタ社もMetaAIを開発しています。そうした利用のなかで報道機関の集めた情報を使ってビジネスしていくという流れが出てきました。日本の報道機関は読売社が先立って提訴しています。その後、2025年8月末には日経新聞と朝日新聞も動き出しています。先行して米国でも動きが出てきています。
提訴の内容としてはAIの学習目的が「研究・教育」であるかという点です。公正な営利目的ではない使用法でAIがスクリーニング(クローン・ボットを動かす作業)しているか、そこが問題。この公正な営利目的ではない研究教育目的は権利侵害に関わらないという立場を米国は取っています。ところが、米国トムソン・ロイター社が原告となった訴訟で第三者経由でAIに学習をさせていた企業は「権利侵害」をしているとの判決が出ています。(デラウェア地裁)一方で合法的に購入した書籍は無断で学習してもよい」といった判決も出ています。(カリフォルニア地裁)
そして、日本の公正取引委員会の見解ではネット検索をする業者に対して「独占禁止法」の観点から問題があると2023年に報告書をまとめています。
(注:引用可能な資料を調べた範囲で、信頼できる情報を織り込みます。ただし法制度は国・州により変わるため、あくまで論点整理としてお読みください。)
生成AIと著作物の利用 — 何が問題になるのか
まず、生成AIが「著作物を学習する」ことは、技術的にどういう意味を持つかを整理しておきましょう。
1:学習と再現の間
生成AI(たとえば ChatGPT や Claude など)は、過去の文章・画像・音声などを「学習データ」として取り込み、その中のパターンを抽象化して出力を生成します。ただし「学習」と「無制限な再現」は異なります。理論上、モデルは訓練中の記憶を一部“暗黙的”に持つことがあります(いわゆる「メモライズ(記憶化)」)が、通常は出力時にフィルタ処理や変形処理が施され、ほぼそのまま再現されることを避けています。
実際、ニューズ記事を対象とした研究では、OpenAI のモデルにおいて「記憶された入力をそのまま出力してしまう割合」は他モデルに比べて比較的低く設計されていると報告されています。arXiv とはいえ、パラメータ数が膨大になるにつれて“近似的再現”のリスクも増すという警戒もあります。
2:RAG(検索拡張生成)との関係
RAG(Retrieval-Augmented Generation:検索拡張型生成)は、AI が検索機能を併用して最新情報を取得・参照しながら応答を生成する方式です。例えば、ユーザーの問いかけに対して検索エンジンを回し、関連文書を取り込んで要約・再構成し、回答を生成します。RAG は、モデルの訓練データだけでなく、Web上の公知情報も動的に利用するという点で、著作物利用の範囲をさらに拡張する可能性があります。
この方式では、AI は「いま検索した情報」を出力に反映しうるため、著作権保護された文章・画像・データベースを引き合いに出すことが起こり得ます。その結果、「検索で取得された情報がそのまま出力され、著作物権利者に無断で参照・コピーされるのではないか」という懸念が生まれます。
3:「ただ乗りか?」という疑念の根源
多くの著作者・出版者が感じるのは、「生成AI は私たちが長年つくってきたコンテンツを“ただ乗り”しているのではないか?」という感覚です。たとえば、書籍、小説、新聞記事、芸術作品などが AI の学習データに含まれている場合、著作者側から見ると「無断で利用され、生成物に使われる可能性がある」という恐れがあります。
こうした疑念は、コンテンツの創造性を尊重したいという思いと、著作権制度による保護を求めたい立場から生じます。単なる不満ではなく、制度・技術・倫理が交錯する場です。
まとめ(約200字)
生成AIは、既存の著作物を学習し、それをもとに出力を作るという性質があります。RAG のような検索併用技術の拡張により、学習対象にとどまらず Web 上の著作物をその場で取り込む可能性も高まります。そのため、著作者からは「ただ乗り」「価値を食いつぶすのでは」という疑念が向けられやすく、この感覚を理解しつつ技術と制度を整えていく必要があります。
訴訟と法制度の最前線 — 米国とその他国の動き
生成AI と著作権をめぐる法制度・訴訟は、現在進行形で変わっています。ここでは、米国を中心とした最新動向を取り上げます。
1:NYT 対 OpenAI 他 — 新生メディア訴訟
ニューヨーク・タイムズ(The New York Times)は、OpenAI や Microsoft を相手取り、同社の新聞記事を無断で学習データとして使ったとして著作権侵害を主張する訴訟を起こしました。2025年3月には、部分的に訴えを棄却しつつも、著作権侵害の主張部分を継続できるという判断が下されています。AP News
この訴訟では、モデルが記事の文言を「そのまま再現する」可能性や、AI 出力が新聞の価値を毀損する構造などが争点となっています。Harvard Law Review+1
2:著者集団 vs OpenAI — 多数訴訟の合流と公正利用論争
複数の著者が OpenAI を著作権侵害で訴える訴訟があり、これら裁判は多地区調整審(MDL:Multidistrict Litigation)で扱われるようになっています。BakerHostetler+2aalrr.com+2
OpenAI 側は、公正利用(Fair Use)という米国の著作権例外論を主張し、「学習目的・変形目的として著作物の一部を用いるのは許容範囲である」という立場を取ります。一方、著者側は「AI が再現できる可能性がある」「著作者の市場価値を害する」という論点を強調しています。ウィキペディア+2Klemchuk+2
3:Anthropic 和解・他の例
Anthropic 社に対して著者が訴えを起こし、2025年9月には、著作権者との間で 15億ドルの和解案 が仮承認されたという報道がありました。Reuters+1 この和解は、AI 企業が訓練データに含まれていた書籍等への補償を行う先例になる可能性があります。
Anthoropic社の判決に対しての見解にも注目です。同社は日本経済新聞の取材を受け「仮承認を嬉しく思う。この決定で、今後は安全なAIシステムの開発に注力できるようになる」とコメントしています(9/29紙面での報道)。著作権を充分に尊重した上でAnthropic社としての業務であるAIシステムの深化を極めていく意思を感じます。
また、出版社 Ziff Davis が OpenAI に対して著作権侵害で提訴しており、AI による無断利用を巡る訴訟は拡大の一途をたどっています。Reuters+1 同様の訴訟を抱える各社の参考となる事でしょう。出版側、AI企業側双方でのビジネスプランの指針となるかと思われます。一説にはこうした訴訟は全米で48件が係争中だという事です。(2025年9月末時点)
まとめ(約200字)
米国では著作権訴訟が多数提起され、OpenAI や Microsoft を相手取るものが合同で進められています。著作権者側は補償・許諾の議論を求め、AI 側は公正利用を主張。特に Anthropic 和解案は先例として注目されます。ただし法理の整理はまだ途上であり、判例形成が鍵となります。
日本とアジアの制度動向・競争政策視点
生成AIの著作権問題は、日本やアジアにも制度・競争政策の観点から影響を及ぼしつつあります。
1:日本の公正取引委員会(JFTC)の調査・報告
2025年6月、公正取引委員会(JFTC)は「生成AI に関する市場調査報告書」を公表しました。これは AI 市場を「インフラ層/モデル層/アプリ層」に分類し、それぞれの層で競争制約や参入障壁の有無を分析したものです。thelegalwire.ai+3日本取引所協会+3Clifford Chance+3
報告書では、まずまだ競争が活発な段階とされつつも、将来的には大手企業が参入障壁を高めうるリスク(たとえば GPU やデータ・人材の集中)を指摘しています。日本取引所協会+3thelegalwire.ai+3mlex.com+3
2:文化庁・法制度整備の議論
日本では、文化庁が「AI と著作権」の考え方案を公表しており、学習利用と許諾制度、クリエイター保護のあり方について国民・事業者から意見募集をしています。これは著作権法改正やガイドライン整備への布石と見られています。networklawreview.org
制度論点としては、「非公開著作物の許諾」「学習目的と営利利用の線引き」「生成物の帰属・表示義務」などが議論対象となるでしょう。
3:競争政策視点からのリスク
JFTC 報告書も取り上げたように、将来 AI 市場での支配力強化、データ・人材リソースの集中、プラットフォームの囲い込みと結びつく競争制限リスクは無視できません。日本取引所協会+2thelegalwire.ai+2
たとえば、生成AI企業が学習のために必要なデータベースや GPU インフラを独占的に保有し、後続者を締め出すような構図が懸念されます。JFTC は将来的な参入阻害・差別的待遇・縛り付き販売(タイイング)などを注視すべきとしています。Clifford Chance+1
まとめ(約200字)
日本でも制度対応が進みつつあり、公正取引委員会は AI 市場の実態調査を進め、競争政策上のリスクを可視化しようとしています。文化庁も著作権制度の見直しを検討中で、学習利用・許諾制度などが課題となります。AI の発展とともに、著作権・競争政策・データ所有権が交差する制度設計がこれから問われます。
総まとめと読者への問いかけ(終章)
生成AI と著作権・権利利用の関係は、技術・制度・倫理が入り混じる難しい領域ですが、以下の点を押さえておきたいと思います。
生成AI は既存著作物を学習データとして使う構造を持ち、記憶・再現リスクを回避する設計が前提です。ただし巨大なモデルでは再現可能性がゼロではありません。
RAG 型の構成では、Web上の情報がリアルタイムで取り込まれ出力に反映されるため、学習データ範囲を超える著作物利用リスクがあります。
米国では多数の訴訟が進行しており、著作者側は補償・権利行使を求め、AI 側は公正利用を主張。合意的解決(和解)や判例の積み上げが鍵です。
日本でも公取委・文化庁などが動き始め、競争政策・制度設計視点から AI 市場の健全性・公平性を守ろうとしています。
最後に読者の皆さんに問いかけたいことがあります。
あなたが創作・発信する立場なら、生成AI に自分の作品を「学習データ」として使われることを、どう考えたいでしょうか?
「無断利用は駄目だ」と言いたいですか? それとも「AI 学習に使われても構わないが、その対価や条件を明示してほしい」と思いますか?
この問いを踏まえて、技術利用者・AI開発者・制度設計者がそれぞれの立場で納得できるルールを模索していくことが、これからの知的生産の土台になるでしょう。
〆最後に〆
以上、間違い・ご意見は
以下アドレスまでお願いします。
全て返信できていませんが 見ています。
適時、改定をします。
nowkouji226@gmail.com