第2回 ChatGPTと著作権


ChatGPTを含む生成AIと著作権については、盛んに議論がなされている。たとえば、米国SFファンタジー作家協会(Science Fiction and Fantasy Writers Association)が「AI及び機械学習の利用に関する現時点の声明(Current Statement on AI/ML Use)」*1を公表しており、その中では「私たちは、自衛のため、自分の名前で公表される作品に誰が貢献したのかわからないような立場に自らを置かないよう、著者に強く求めます*2」としているが、これはChatGPT等の学習型AIの利用に対するネガティブな態度の表明と理解される。

このような中で、現在、AIと著作権に関する議論が進められており、2023年6月30日には、第23期文化審議会著作権分科会における主な検討課題に「生成AIと著作権に関する論点整理について」を含めることが決められた*3。今後は議論がより成熟していくことが期待される。なお、すでに文化庁が「AIと著作権」というセミナー資料を公表している*4

ChatGPTと著作権をめぐっては、主に学習段階プロンプトとしての入力、そして出力結果の利用が問題となることから、以下、順に現時点の議論を簡単に検討していきたい。【→本書82〜120頁】
 

(1) 学習段階

学習段階については著作権法30条の4*5、特に同条第2号が適用される余地が大きい。すなわち、著作物を学習用データとして収集・複製し、学習用データセットを作成し、データセットを学習に利用して、AI(学習済みモデル)を開発するような場合は、享受を目的としておらず、情報解析のための利用として、許諾なくして適法に複製等を行うことができる。

ここで、享受する目的がある場合の複製等であって、軽微利用の場合は著作権法47条の5で許容される。しかし、享受目的がある場合で軽微利用目的ではない場合には、原則通り著作権者からライセンスを受ける必要がある*6

そうすると、AI学習のための利用は一般に享受目的がないことが多いとされているものの、「享受する目的が併存」しているような場合、このような利用行為には著作権法30条の4は適用されないことになるだろう(上記文化庁「AIと著作権」38頁)。享受する目的が併存する場合として、内閣府の「AIと著作権の関係等について*7」は、「例えば、3DCG映像作成のため風景写真から必要な情報を抽出する場合であって、元の風景写真の『表現上の本質的な特徴』を感じ取れるような映像の作成を目的として行う場合は、元の風景写真を享受することも目的に含まれていると考えられることから、このような情報抽出のために著作物を利用する行為は、本条〔著作権法30条の4〕の対象とならないと考えられる」とする。もちろん、ここで想定されているのはあくまでも、元の風景写真の翻案物を作ろうとしている場合で、だからこそ享受目的があるとされていることには十分に留意が必要である(つまり、一般的な「風景写真」を作ろうとして学習させている場合まで、この議論の射程に入れるべきではない)。

いずれにせよ、学習段階は著作権法30条の4が適用される余地が大きいものの、例外的にこれが適用されず、権利者からライセンスを取得せずに学習段階で複製等をすることが著作権侵害になる場合がないわけではない

 

(2)プロンプトとしての入力

たとえば、ChatGPTに論文の内容を要約させるために、ChatGPTにプロンプトとして当該論文を複製して投入することは、当該論文の著作権者の著作権を侵害するのだろうか。この場合も、AIにデータを投入して「情報解析」(著作権法30条の4)をさせる場合だとして、著作権法30条の4によって適法とされる可能性がある。

もっとも学習の場合には、出力までの間に典型的には《学習→学習済みモデル生成→プロンプト入力→AIによる処理→出力》という過程が存在するところ、プロンプト入力の場合はこのような過程のうち後半の《プロンプト入力→AIによる処理→出力》部分だけであることから、学習よりもリスクが高まるだろう。

なお、プロンプトそのものが著作物として保護されるか、という論点も別途存在する。


(3)出力結果の利用

議論がより激しいのは出力段階であろう。たとえば、弁護士AがChatGPTに法律相談をしたところ、当該質問とまったく同じ質問に対する弁護士Bによる回答がインターネット上に存在し、ChatGPTがその回答と一字一句同じ回答を出力するという事象が考えられる。この場合にAがその回答をコピペしてHPやSNSに投稿した場合、Aの行為はBの著作権を侵害するのだろうか。

この点については、複製権・翻案権侵害であれば依拠性――他人の著作物に接し、これを自己の作品の中に用いること――が必要とされる*8。そこで、学習を通じた依拠と、ユーザ自身の知識や経験に基づく依拠の双方が論じられている。まず、学習を通じた依拠としては、大量の著作物を学習している中で、弁護士Bの回答も学習の対象となっていれば、それこそが依拠だ(つまり、Aの行為は著作権侵害である)、と論じる余地があるということである。もっとも、通常の学習型AIは、学習済みモデルそのものに学習対象のデータを含んでいるものではなく、パラメーター化されている。そのような抽象化・断片化されたパラメーターにおいてBの回答の(いわば)「痕跡」が残っているというだけで、依拠を肯定できるとすると、機械学習はデータの量が正義(MORE DATA)として、大量のデータを学習することから、ある意味では「インターネット上にある情報であればすべて依拠あり」ということにもなりかねない。そのように広く依拠を肯定し、著作権侵害を広範に肯定するべきかという点が問題となるだろう。

次に、ユーザ自身の知識や経験に基づく依拠というのは、「ユーザAがBの回答を知った上でChatGPTにその出力を求めていれば、そこに依拠を肯定できる」という議論である。ただ、単に法律相談への適切な回答をしたい、というだけで質問をプロンプトとして入力したところ、「たまたま」ユーザAとして知っているBの回答が出力された、というだけで常に依拠性を認めていいかは疑問があるところである。

なお、人工知能が自律的に生成した生成物(AI創作物)は、思想または感情を表現したものではなく、単純に「謝罪メールを書いてくれ」などと指示しただけではChatGPTによって作成された謝罪メールについて、人間の思想感情が含まれるとは言えず、またユーザも創作的寄与をしているとは言えないため、著作物ではない。もっとも、校正にChatGPTを使うといったことであれば、校正後の書面についてもなおユーザに創作的寄与があり、ユーザの思想や感情を反映したユーザの著作物だと言える可能性があるし、ChatGPTの回答を踏まえてユーザが修正をするなど、AI出力後におけるユーザの利用過程で新たに創作的寄与が付与され、当該修正部分についてユーザが著作権を得ることもあるだろう*9

***

冒頭で述べた通り、これからAIと著作権に関する議論が深められると言われており、今回はその中における現状を簡単にまとめたものである。その他、本書では、不正競争防止法・秘密管理【121-130頁】、セキュリティ【131-138頁】、独禁法【138-144頁】、不正検知【144-148頁】、名誉毀損【149-162頁】等について論じているので、興味がある方はぜひとも本書をご参照いただきたい。

次回は、実務上のChatGPT利用方法について検討していく。

 

* 本エントリ執筆後、柿沼太一「『生成AIと著作権侵害』の論点についてとことん検討してみる」(https://storialaw.jp/blog/9748)および奥邨弘司「生成AIと著作権に関する米国の動き」コピライト2023年7月号が公表された。

 

*1:https://www.sfwa.org/2023/06/13/current-statement-on-ai-ml-use/

*2:we urge authors as a matter of self-protection not to put themselves into a position where they do not know who contributed to a work with their name on it.

*3:文化審議会著作権分科会(第68回)(第23期第1回)資料4「第23期文化審議会著作権分科会における主な検討課題について」(https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/bunkakai/68/pdf/93910101_04.pdf)参照。

*4:https://www.bunka.go.jp/seisaku/chosakuken/pdf/93903601_01.pdf

*5:「(著作物に表現された思想又は感情の享受を目的としない利用)
第30条の4 著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
一 著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合
二 情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第47条の5第1項第2号において同じ。)の用に供する場合
三 前二号に掲げる場合のほか、著作物の表現についての人の知覚による認識を伴うことなく当該著作物を電子計算機による情報処理の過程における利用その他の利用(プログラムの著作物にあつては、当該著作物の電子計算機における実行を除く。)に供する場合」

*6:複製等の目的が何かで切り分ける考えは立法当時から存在していた。加戸守行「平成30年改正著作権法施行に伴う柔軟な権利制限規定による著作物の利用拡大とこれからの課題(下)」NBL1145号(2019年)32〜33頁[秋山発言]参照。

*7:https://www8.cao.go.jp/cstp/ai/ai_team/3kai/shiryo.pdf

*8:中山信弘『著作権法〔第3版〕』(有斐閣・2020年)709頁。

*9:著作権審議会第9小委員会(コンピュータ創作物関係)報告書(https://www.cric.or.jp/db/report/h5_11_2/h5_11_2_main.html#3_1)等参照。

Copyright © 2023 KOUBUNDOU Publishers Inc.All Rights Reserved.