ソフトウェア

「二次創作作品を無断でAIトレーニング用のデータセットにする行為」や「AI生成による二次創作」といったAI動向に対する海外勢の反対意見はどうなっているのか?


生成AIの登場によって、誰でも簡単に文章やイラストを作ることができるようになりましたが、AIの学習元となっているデータセットの中にはインターネット上から無断で収集されたものも多く、著作権を巡って大きな議論となっています。IT系ニュースサイトのThe Vergeが、インターネット上に公開されている二次創作作品のスクレイピングを巡って海外のファンコミュニティで巻き起こった騒動について、当事者たちの意見をまとめています。

Fanfiction writers battle AI, one scrape at a time | The Verge
https://www.theverge.com/ai-artificial-intelligence/688640/fanfiction-ai


2025年4月、オープンソースAIプラットフォーム・Hugging Faceの「nyuuzyou」というユーザーが、ファンフィクション投稿サイト「Archive of Our Own(AO3)」から約1260万件もの作品をスクレイピングし、そのデータセットをHugging Faceにアップロードしました。

nyuuzyouによるスクレイピングはすぐにRedditの「r/AO3」コミュニティで明らかとなり、多くのユーザーが怒りの声を上げました。また、Hugging Face上のデータセットのコメント欄は騒然となり、ファンフィクション作家たちとAI擁護派との間で激しい議論が巻き起こりました。


nyuuzyouのスクレイピングを擁護するユーザーは「どうせ大手テック企業のクローラーボットがすでにAO3を何度もスクレイピングしている」と主張。これに対して反対派は、「スクレイピングをするような人たちは、二次創作の作家が声を上げないことにつけこんで労働と創造性を搾取しているのだ」と反論しています。

2023年、OpenAIのChatGPTを用いた「Sudowrite」というAI執筆支援ツールが登場しました。そして、2023年の後半頃から、Sudowriteの出力するテキストに「オメガバース」という二次創作用語が登場するようになり、「Sudowriteの元となっているChatGPTの学習に二次創作作品が使われているのではないか」と話題になりました。これを受けて、多くの二次創作作家は、AIによる二次創作作品の生成に反対する運動を展開しています。


infinitegalaxies」という名前でスター・ウォーズの二次創作、とりわけエピソード7~9に登場するレイとカイロ・レンのカップリングを意味する「Reylo」ジャンルで活動するNikkiさんが、自分の作品がスクレイピングの対象になっていないかを検索したところ、70作以上の作品が知らないうちにスクレイピングされていたことを知りました。その中には、AIによるファンダムへの脅威について11人の作家と共著で書いたエッセイも含まれていたとのこと。

Nikkiさんは、Sudowriteがキャラクター設定やプロット情報を入力するだけで小説を生成できるという動画を見て、衝撃を受け、涙を流したそうです。ソフトウェア企業で働いているというNikkiさんは職場でAIが導入される流れをすでに目の当たりにしていましたが、自分の趣味の領域にまで影響が及ぶとは想像していなかったとのこと。

Nikkiさんは「ファンコミュニティというのは基本的に『贈与経済』なのです。私たちは純粋に楽しむために、善意から活動しています。お互いに作品を贈り合い、コミュニティの中で一緒に創作しているのです。時間も労力も、心も魂も注いで作り上げ、コミュニティの中で共有するのです。それをたった数秒で、画面にポンと吐き出すだけなんて………誰がそんなものを求めたんですか?本当に気持ち悪いです」と述べました。


さらにNikkiさんは、「これは本質的に盗みです。盗まれた労働に基づいて構築されたものに、倫理的な使い方なんてありません。同意なしに収集されたデータを基にしているという根本の問題だけでなく、ファンコミュニティの『贈与と共有』という文化にも反する行為です」と訴えました。

Nikkiさんらはnyuuzyouによるスクレイピングに対し、デジタルミレニアム著作権法(DMCA)に基づいた削除申請をオンラインで連携して行いました。また、AO3を運営する非営利団体「Organization for Transformative Works(OTW)」も削除申請を提出しました。これにより、4月9日にはHugging Faceが問題のデータセットを無効化しています。


一方でnyuuzyouは、Hugging Face上のデータ削除に対して異議申し立てを提出し、同じデータセットをロシアや中国など、DMCAに基づく削除要請に対して応じにくいホスティングサイトに再アップロードしました。The Vergeがnyuuzyouに連絡を取ったところ、nyuuzyouは自分がロシア在住の学生兼IT技術者であると名乗り、「二次創作に興味があるのではなく、純粋に研究目的でデータをアップロードしただけ」と語りました。また、nyuuzyouはOTWが自分のデータセットに対して強硬な対応を取ったことに驚いたと述べ、「研究用データセットと保存目的との整合性について対話ができればと思っていました」と語っています。

しかし、分散型人工知能研究所(DAIR)の研究ディレクターであるアレックス・ハンナ氏は、nyuuzyouの主張に対して「非常に不誠実です。言語モデルの学習に使わないのであれば、なぜウェブ上にそんな大量の非構造データを公開する必要があるのでしょうか?」と疑問を呈しています。

Nikkiさんはnyuuzyouの説明をThe Vergeから聞かされ、さらに強い怒りを感じたと述べ、「ファンコミュニティに侵入してくるAIに対して、今後も断固として立ち向かっていく覚悟です。私から喧嘩を売ることはありません。でも、誰かがこちらに喧嘩を売ってきたら、私は戦います」とコメントしました。

この記事のタイトルとURLをコピーする

・関連記事
GoogleはYouTubeにアップロードされた動画をAIのトレーニングに使用しているがクリエイターはあまり把握していないことが判明 - GIGAZINE

「Bluesky運営元はユーザーの投稿をAI学習に使わないが第三者はAI学習できてしまう」という実例が登場、BlueskyのAPI経由で100万投稿分のデータセットがHugging Faceで公開されてしまう - GIGAZINE

RedditがAnthropicを提訴、ライセンス契約なしにサイトのデータをAIモデルの学習に使用したと主張 - GIGAZINE

Discordの20億件以上のメッセージが公開APIを使ってスクレイピングされオンラインで公開されてしまう、2015年から2024年まで3167サーバー分 - GIGAZINE

「AI企業がトレーニングに使った著作物の公開を義務づける修正案」をイギリス貴族院が可決、無断使用OKとの政府方針を拒否 - GIGAZINE

音声ファイル共有サービスのSoundCloudが音声データをAI学習に利用できるよう利用規約をひっそり変更も「AI学習にユーザーの音声ファイルは利用していない」と言及、利用する際には通知&オプトアウト可能にすると約束 - GIGAZINE

「執拗なAIスクレイピングがインフラストラクチャに負担をかけている」とWikimedia財団が発表 - GIGAZINE

CloudflareがAIクローラーを無限生成迷路に閉じ込める「AI Labyrinth」を発表 - GIGAZINE

in ソフトウェア,   ネットサービス, Posted by log1i_yk

You can read the machine translated English article What about overseas opposition to AI tre….