ノートパソコンの画面に、多数の楽曲ファイルがAIモデルのトレーニングデータとして並ぶ様子。周囲にはバッド・バニー、ビートルズなどのアーティスト名が浮かんでいる。
ノートパソコンの画面に、多数の楽曲ファイルがAIモデルのトレーニングデータとして並ぶ様子。周囲にはバッド・バニー、ビートルズなどのアーティスト名が浮かんでいる。

無許可の楽曲利用がAI開発で広がっている可能性があり、この話題を追う音楽ファンやクリエイターにとって気になる文脈が見えてきます。

AI音楽生成に使われた楽曲データ 記事の流れと主な事実

AI音楽生成モデルのトレーニングに、著作権保護下にある多数の楽曲が無許可で使われている可能性が指摘されています。The Atlanticのアレックス・ライスナー氏は、AI開発コミュニティで共有されている4つの楽曲データセットを調査しました。その結果、1つのデータセットに1200万曲、別のデータセットに900万曲が含まれており、バッド・バニー、ニルヴァーナ、テイラー・スウィフトなど世界的なアーティストの楽曲が多数含まれていることがわかりました。

これらのデータセットのうち3つは、YouTubeやSpotify上の楽曲へのリンク集として配布されており、AI開発者が自動化ツールを使って音声ファイルをダウンロードして利用しているとされています。しかし、そのようなツールはプラットフォームの利用規約に違反する可能性があります。残る1つのデータセットは、著作権フリーの音楽を集めたFree Music Archiveのものですが、個人利用は無料でも商用利用にはライセンスが必要です。

データセットは数千回以上ダウンロードされており、誰が使ったかを特定するのは困難です。しかし、GoogleやStability AIが研究論文でこれらのデータセットを利用したことを明記している例もあります。The Atlanticは、これらのデータセットに含まれる楽曲を検索できるデータベースも公開しています。

主な事実

  • The Atlanticの調査で、AIトレーニング用に1200万曲と900万曲を含むデータセットが発見された
  • データセットにはバッド・バニー、ニルヴァーナ、テイラー・スウィフト、ビートルズなどの楽曲が含まれている
  • 3つのデータセットはYouTubeやSpotifyのリンク集で、自動ダウンロードツールが使われていると指摘されている
  • GoogleやStability AIは研究論文でこれらのデータセットの使用を明記している
  • The Atlanticはデータセット内の楽曲を検索可能なデータベースを公開している

Cantoのビジュアルニュース解説です。制作にはAIツールが補助的に使われることがあります。 編集方針