ネットサービス

Googleの検索結果に表示されたコンテンツをAIトレーニングのため違法に盗んだとしてRedditがPerplexityなど4社を提訴


ソーシャル掲示板サイトのRedditが、「Googleの検索結果に表示されたRedditのコンテンツをスクレイピングしてデータを違法に盗んだ」として、AI企業のPerplexityなど4社を相手取った訴訟を起こしました。Redditは2025年6月にAI「Claude(クロード)」開発元のAnthropicを提訴しています。

Reddit Accuses ‘Data Scraper’ Companies of Theft - The New York Times
https://www.nytimes.com/2025/10/22/technology/reddit-data-scrapers-perplexity-theft.html


Reddit sues Perplexity for scraping data to train AI system | Reuters
https://www.reuters.com/world/reddit-sues-perplexity-scraping-data-train-ai-system-2025-10-22/


Reddit sues Perplexity and three other companies for allegedly using its content without paying
https://www.engadget.com/social-media/reddit-sues-perplexity-and-three-other-companies-for-allegedly-using-its-content-without-paying-205136436.html

Redditが訴えたのはPerplexityのほか、テキサス州オースティンに本拠を置くSerpApi、リトアニアに本拠を置くOxylabs、ロシアに本拠を置くAWMProxyです。

Redditは2023年から、投稿された内容にアクセスしてAIのトレーニングに利用しようとする企業から対価を得て利益を上げるビジネスを始めており、GoogleやOpenAIとライセンス契約を結んでいます。Googleの場合、ライセンス料は年間6000万ドル(約91億4000万円)だとのこと。

GoogleがRedditの投稿内容をAPIでリアルタイム取得してAIのトレーニングに活用へ、Redditは新規株式公開目前 - GIGAZINE


Googleの検索結果に表示されたRedditのコンテンツを利用することで、こうしたライセンス料の支払いから逃れたとして、Redditは4社に対して金銭的損害賠償と、過去にスクレイピングしたRedditのコンテンツをトレーニング用データとして販売することを禁止する恒久的差し止め命令を求めています。

訴えられた企業のうち、Perplexityはライセンス料を支払っていないコンテンツをトレーニング用に流用していることがすでに明らかになっているほか、スクレイピングを防ぐためにウェブサイトが用意しているrobots.txtを無視していることも指摘されています。指摘を受けた際、アラヴィンド・スリニヴァスCEOは「自社のクローラーで無視しているわけではないが、サードパーティー製クローラーにも頼っている」と弁明しています。

「PerplexityのAIがクローラーをブロックするrobots.txtを無視している」との指摘に対しCEOが「無視しているわけではないがサードパーティーのクローラーに依存している」と主張 - GIGAZINE


Redditによると、Perplexityにはすでにスクレイピングをやめるよう要請しているものの、「Google検索でのクロール以外ではアクセス不可能なテスト投稿」を作成することで、Perplexityがスクレイピングを続けていることを確認できたとのこと。

訴えに対してSerpApi、Oxylabs、AWMProxyはコメントしていません。Perplexityは「訴状はまだ受け取っていませんが、我々は公共の知識に自由かつ公正にアクセスするユーザーの権利のため、常に力強く戦っていきます。我々のアプローチは、正確なAIにより事実に基づいた回答を提供することであり、原則的かつ責任あるものであるということに変わりはなく、オープン性と交易に対する脅威を容認するものではありません」とコメントしています。

この記事のタイトルとURLをコピーする

・関連記事
AI学習目的のスクレイピングに対して利用条件や利用料金を通知する仕組み「RSL」が開発される、すでにYahoo・Reddit・オライリーなどが採用を表明 - GIGAZINE

RedditがInternet Archiveをブロック、AI企業によるWayback Machineのアーカイブ不正利用を阻止するため - GIGAZINE

RedditがGoogle以外のAIがコンテンツをトレーニングに利用することを防ぐための施策を強いられているとしてMicrosoft・Anthropic・Perplexityを名指しで批判、「面倒なので本当はやりたくない」と発言 - GIGAZINE

RedditがGoogle以外の検索エンジンによるコンテンツの取得をブロックしているという指摘 - GIGAZINE

in AI,   ネットサービス, Posted by logc_nt

You can read the machine translated English article Reddit sues Perplexity and four other co….