知財学者の生成AI規制論:「生成」と「学習」を区別して対応を

Dragon Claws/iStock

2/23日経新聞経済教室欄 上野達弘・早稲田大学教授「AI規制の論点㊤「『生成』と『学習』区別し、対応を」(以下、「上野論考」)は、生成AIの登場により脚光を浴びる著作権侵害問題について、生成(出力)と学習(入力)に分けて対応することを提案するとともに激しい議論があるAI学習(入力)と著作権の問題について興味深い論考を展開している。

文化庁『AI と著作権に関する考え方』をまとめる」で紹介した2/29の著作権分科会法制度小委員会でも、ある委員が言及していたこの論考を概観する。

著作権法の情報解析規定

(前略)

矢面に立っているのが、情報解析規定と呼ばれる著作権法上の規定だ。この規定は、情報解析の目的であれば著作権のある著作物を大量に利用することを原則自由と定める。09年に導入され、18年にはAIも念頭に拡大された規定だ。

2018年にAIも念頭に拡大された規定は、柔軟な権利制限規定とよばれる三つの条文を新設した。新30条の4では著作物に表現された思想又は感情の享受を目的としない利用を認めた。

(中略)

ChatGPTや画像生成AIが飛躍的発展を遂げた22年以降、特にクリエイターやメディアがこの規定に懸念を示している。報道コンテンツが生成AIにより無断利用されることに反対する声は根強い。

報道コンテンツが生成AIにより無断利用されることに反対する日本新聞協会は、「『AIと著作権に関する考え方について(素案)』に対する意見」で第30条の4の在り方について「当協会は、根本的な法改正に向けた議論が必要だと考える。」としている。

情報解析規定が対象とする行為はAI学習に限られるものではなく、大量データ解析を広く含む。例えばSNS(交流サイト)における大量の書き込みを網羅的に収集・解析して将来の流行を予測したり、大量の医学論文を網羅的に解析して新しい製品や治療法を開発したりすることも、この規定の対象だ。こうした 大量データ解析は広く社会に便益をもたらすといえるが、論文はもちろんネット上の書き込みにも著作権が存在する以上、網羅的解析は情報解析規定がなければ、事実上不可能だ。

(中略)

情報解析規定はビジネスを優先する代わりに、著作権を制約したものと受け止められるかもしれない。だが、規定の趣旨からすると、そうした見方は正確ではない。日本の情報解析規定はいわゆる「非享受利用 」(作品の鑑賞などを目的としない利用)に関する規定に位置付けられている。そこでは、著作権という権利は作品の鑑賞など人の享受があるから保護が認められるという理解を前提としており、著作物の享受がない場合は著作権が保護する利益は害されていると評価できないという考えが背景にある。

そして大量の著作物を情報解析するのは、誰も著作物を享受するわけではないから、まさに非享受利用にあたることになる。日本の情報解析規定は、本来著作権が及ばない行為を自由としたに過ぎない。

30条の4のような個別の権利制限規定のない米国では、権利制限の一般規定であるフェアユースに該当するか否かで判定することになる。米国では2022年11月のChatGPTの登場以来、著作権侵害訴訟が頻発した。今年から出始めると思われるそれらの判決の中でも注目されるのは「米地裁 生成AIの著作権侵害訴訟に初の注目すべき判決」で紹介したロイター事件判決である。

被告は事実審理なしに法解釈だけで判決を下す略式判決を要求したが、30条の4以上に柔軟な権利制限規定といえるフェアユースの判定は具体的事実に依拠する部分が多い。

このため、陪審による事実認定に結論は委ねたが法律解釈を示した判事は、多くの大規模言語モデル(LLM)がそうしているように創造的な表現を複製する目的ではなく、言語パターンを学習する目的で著作権のある作品を摂取し、それらをAIの訓練用に使用することは変容的利用でフェアユースに該当すると判示した。このように米国でも学習(入力)についてはフェアユースが認められる可能性が高い。

生成(出力)は別問題

上野論考は続ける。

誤解すべきでないのは、情報解析規定は生成AIによる著作物利用をすべて許容するものでは決してないことだ。つまりこの規定は学習(入力)を許容するものに過ぎず、生成(出力)は別問題だ。従って生成AIの出力が他人の著作物と創作的表現のレベルで共通する場合、それは当然、著作権侵害に当たり得る。

他方、生成AIの出力が単に事実や画風・スタイルのレベルで他人の著作物と共通するにすぎない場合、そうした出力は著作権侵害にならない。これは著作権法の大原則だが、たとえ 出力が適法だったとしても、著作権のある著作物を無断でAI学習に利用されること自体を著作権で止めたいとの声があるのも事実だ。

ただ仮にAI学習を著作権で止めたとしても、著作権侵害やディープフェイクの出力がなくなるわけではない。そうである以上、違法有害な出力については、そうした出力自体を防止する策を講じる必要がある。AI学習それ自体を 著作権でコントロールできるようにしても効果がないばかりか、あらゆる分野の様々な大量データ解析を阻害しかね、得策とはいい難い。

そしてたとえ情報解析に著作権が及ばなくても、解析を目的としたデータ提供契約を締結することは可能であり有用でもある。情報解析をする者にとっては、雑誌論文や新聞記事の個別収集がたとえ著作権法上自由であっても、権利者と契約して、そのデジタルデータを解析に適した形で網羅的に取得できるメリットは大きい。実際、オープンAIは23年7月に米AP通信と2023年12月に独アクセル・シュプリンガーとAI学習のための記事利用に関する契約を結んでいる。

権利がなければ契約が成立しないという見方は誤解であり実際にも反する。コンテンツ保有者は、著作権でAI学習をコントロールすることを目指すより、データ提供契約など、著作権法以外の手段による共存の道を探るべきではないか。

生成AIの「影」は、学習(入力)ではなく生成(出力)にある。両者をはっきり切り分けないと、生成AIの「光」の部分にも陰りをもたらしかねない。

生成AIのような画期的新技術が著作権侵害の懸念を巻き起こし、訴訟にも発展した例として思い浮かぶのはYouTubeである。今では大メディアに成長したYouTubeも、当初は著作権侵害コンテンツの温床となった。

メディア大手のバイアコム(現パラマウント)から訴えられるなど、今回同様、著作権侵害訴訟の先例も浴びた。米国のデジタルミレニアム著作権法では、サービス・プロバイダーは著作権者からの要請に応じて違法コンテンツを削除していれば著作権侵害責任を問われない。こうしたプロバイダーに好意的な著作権法も味方してYouTubeは訴訟の試練も乗り切った。

新技術の光の部分にかげりをもたらした事例

日本にもこうした画期的技術は存在した。YouTubeより3年前に開発され、昨年、映画化もされたWinnyである。「国破れて著作権法あり~誰がWinnyと日本の未来を葬ったのか」「第2章 世界の最先端を走っていたP2P技術の商用化を遅らせたウィニー事件」でも紹介した壇俊光『Winny 天才プログラマー金子勇との7年半 (NextPublishing) 』(インプレスR&D、以下、「金子勇との7年半」)の「発刊によせて」で、金子氏が、新しいP2P ファイル共有ソフトの開発宣言をした「2ちゃんねる」開設者のひろゆき氏は以下のコメントをよせている。

LINEでの動画共有とかビットコインなどの仮想通貨とか、P2Pといわれる技術が使われています。その最先端がWinnyでした。金子さんがいれば、日本で発展した技術が世界で使われて、世界中からお金が入ってくるみたいな世の中にできたかもしれなかったんですけどね。

壇氏も「金子勇との7年半」で「コンテンツ配信の世界は、iTunesやYoutubeに席捲された。P2Pの技術開発は日本から失われた。日本が海外のサービスを模倣するだけになってずいぶん経つたような気がする」(158頁)と残念がる。

上野論考の指摘するように光の部分に陰りをもたらさないような著作権法の対応が望まれる。