[著作権法](2018年改正、2019年1月1日施行)

第五款 著作権の制限著作物に表現された思想又は感情の享受を目的としない利用) 第三十条の四 著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。

  •  一 著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合

  •  二 情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第四十七条の五第一項第二号において同じ。)の用に供する場合

  •  三 前二号に掲げる場合のほか、著作物の表現についての人の知覚による認識を伴うことなく当該著作物を電子計算機による情報処理の過程における利用その他の利用(プログラムの著作物にあつては、当該著作物の電子計算機における実行を除く。)に供する場合

  • #著作権法第三十条の四#著作権法30条の4

ソースコードを学習してコメントからソースコードを生成するモデルの学習データにGPLのコードが入ったらどうなるのか、という話題があったが、そもそもこの利用法に関しては著作権が制限されている。

  • まあ、僕がモデルを作る側だったら明示的にGPLだと宣言してるコードは学習データから外すけどね、たいして難しい処理でもないし。
  • それによって出力されたコードがたまたまGPLのコードに一致したとしても、それは依拠性がないので著作権の侵害にはならない。

解説