目次

AI開発の際に注意すべき法律問題(著作権や個人情報保護)

AIの研究開発に取り組む際、まずは教師データが必要です。社内の眠っているデータを使用したり、自社でデータ作成を行えることもありますが、多くの場合、それだけではモデルを学習させるにはデータ量が不足してしまいます。そうなりましたら、代行サービスに依頼したり、公開データを探すでしょう。データ利用には制約があったり、違法となる場合もあるので十分ご注意が必要です。例えば、データスクレイピングはいくつかのWebサイトの利用契約に反する可能性があります。Twitterではサービス利用契約によって、APIの利用が必須となっています。成果をラボ外に出さない研究でも、問題になるケースもあります。今回は、データの著作権や個人情報保護法など、AI開発の際に注意すべき法律問題についてまとめました。

AIにおける主な知的財産権

データは無体物なので、所有権や占有権の対象にはなりませんが、著作権や個人情報保護法などが該当します。ここでは、AIにおける著者件や個人情報保護法で抑えておきたいポイントをまとめていきます。

AIにおける著作権

一般的に、著作物(データセットなど)は著作権者に無断で利用(ダウンロードや改変など)することができません。しかし日本では、AI開発を目的とする場合は、一定条件のもとで著作権者の許諾なく著作物を利用できます。このことから日本は「機械学習パラダイス」とも言われています。2019年1月1日の法改正からは、著作権法30条の4によって、AIにおける著作物の取り扱いは柔軟化され、AI生成のために準備されたデータセットを第三者へ販売や公開することが適法となりました。さらに「非享受利用」についても定めらていて、他人の著作物(音楽や動画などのコンテンツ)を、知的又は精神的要求を満たす目的でない場合(非享受な目的)は、著作権者の同意なく利用可能です。また、著作権法47条の5によって、著作物の「軽微利用」につきましても定められています。著作権者に与える不利益が軽微である一定の利用を行う場合、こちらも著作権者の同意なく利用可能です。

AIにおける個人情報保護

データは複製が容易であり、一度不正取得されると、一気に拡散される恐れがあるため、個人情報を扱う際は特に留意が必要です。個人情報保護法は2015年9月に改正(2017年5月に施行)され、3年毎に見直す規定が盛り込まれました。取得自体が個人情報保護法に触れてしまうデータもあるので、ご注意ください。個人情報といいますと「要配慮個人情報」と該当する介護や医療情報などが頭に浮かぶことが多いかと思いますが、それだけではありません。一見個人情報と見えないものでも、他の情報と容易に照合することによって、個人を識別することができる場合でも、個人情報保護法に触れる可能性だってあります。

著作権と個人情報保護以外にも、特許権、営業秘密、不正競争防止法などの法律問題もありますので、慎重な確認を重ねることが大事です。今後は、AIの研究開発が進化する中、個人情報やセキュリティの面で標準化が進むと想定されています。既に2018年5月には不正競争防止法及び著作憲法が改正され、経済財務省より「AI・データの利用に関する契約ガイドライン」が公開されています。

※ AI関連法は常に変わっているので、貴社プロジェクトのタイミングに合わせ、最新の法律をご確認ください。

お探しのデータセットが見つからない場合

お探しのデータセットが見つからない場合は、当社が既存のパッケージデータセットからご用意いたします。追加作成分もお手伝いします。音声、画像、動画、アノテーション等のサービスを提供し、研究開発を支援しております。音声データの文字起こしや音韻表記など、様々なデータやアノテーションタイプに対応できるため、多言語チャットボット、OCR、顔認証、自動運転など、幅広い研究開発向けの教師データをご用意できます。

アラビア語音声コーパス

国立研究開発法人情報通信研究機構(NICT)では、先進的な音声認識及び自動翻訳技術の研究開発を推進しており、これらの研究開発における、アラビア語の音声翻訳対応のために必要な音声認識学習用コーパスを必要とされていました。

無料
機械学習用
音声コーパス
YouTubeビデオから抽出した10秒程度のサウンドクリップ他

随時追加中