外部委託でAI開発やデータ分析を進める際に、誰が何を利用・改変・再学習・削除できるかを、契約、知財、個人情報、AIガバナンスの観点から整理します。
データ、モデル、ログ、第三者素材を行為単位で整理します。
データ、モデル、ログ、第三者素材を行為単位で整理します。
企業が外部ベンダー、システム開発会社、AIスタートアップ、データ分析会社、個人のフリーランス、研究機関等に業務を委託すると、成果物は一つではありません。報告書、ソースコード、学習用データセット、加工済みデータ、特徴量、埋め込みベクトル、モデルの重み、ハイパーパラメータ、評価ログ、プロンプト、推論結果、ダッシュボード、運用ノウハウ、チューニング手順、セキュリティログなど、多数の情報資産が発生する。
このとき、現場で最も危険な誤解は「委託料を払ったのだから、成果物もデータもAIモデルも当然に発注者のものになる」という理解です。日本法上、データそのものに一律の「所有権」が成立するわけではありません。著作権、特許権、営業秘密、限定提供データ、個人情報保護法上の規律、契約上の利用権、秘密保持義務、クラウドサービス規約、OSSライセンス、モデル提供者の利用条件が重なって、初めて実務上の権利関係が決まる。
したがって、「業務委託で生まれたデータ・AIモデルの権利整理」の中核は、次の問いに分解される。
このページの結論は明確です。契約書に「成果物は発注者に帰属する」と書くだけでは足りない。 データとAIモデルを構成要素ごとに分解し、所有・帰属ではなく、利用、複製、改変、再学習、提供、開示、商用化、監査、削除、証跡保存、第三者対応という行為ベースで権限を設計する必要があります。
次の一覧は、権利整理で最初に分解すべき問いを整理したものです。読者にとって重要なのは、所有の一問に閉じず、利用・再学習・提供・削除まで行為単位で確認することです。各項目から契約別紙に落とすべき論点を読み取ってください。
委託前から存在したデータ、ソフトウェア、モデル、ノウハウを誰が留保するかを確認します。
収集、加工、生成、学習、評価されたデータを誰がどの目的で利用できるかを定めます。
ソースコード、重み、アーキテクチャ、API、評価結果、モデルカードを分けて扱います。
発注者データを自社モデル改善、他社案件、研究開発、営業資料に使えるかを明記します。
契約終了後の継続利用、返却、削除、第三者保守委託、M&A時承継を確認します。
データ、モデル、ログ、第三者素材を行為単位で整理します。
このページは、主として日本法と日本の官公庁資料を基礎にする。特に、経済産業省の「AI・データの利用に関する契約ガイドライン」および「AIの利用・開発に関する契約チェックリスト」は、データ契約・AI開発契約の論点整理として実務上重要です。経済産業省は、データ利用契約やAI技術を利用するソフトウェアの開発・利用契約について、主な課題、論点、契約条項例、条項作成時の考慮要素等を整理している。
また、AI法制・ガバナンスについては、2025年に公布・施行された「人工知能関連技術の研究開発及び活用の推進に関する法律」(いわゆるAI法)や、2026年4月1日最終更新の「AI事業者ガイドライン(第1.2版)」も参照すべきです。著作権については文化庁の「AIと著作権に関する考え方について」、個人情報については個人情報保護委員会の通則ガイドラインと生成AIサービス利用時の注意喚起、不正競争防止法については経済産業省の営業秘密・限定提供データに関する資料、特許については特許庁のAI関連技術に関する特許審査事例および職務発明制度の資料を参照する。
データ、モデル、ログ、第三者素材を行為単位で整理します。
「業務委託」は、実務上広く使われる言葉ですが、民法上の典型契約名そのものではありません。実際には、請負、準委任、委任、売買、ライセンス、共同研究、SaaS利用、保守運用、データ処理委託、コンサルティング等が混在する。AI開発案件では、PoC、要件定義、データ分析、モデル開発、運用保守、継続改善が一つの基本契約に束ねられ、請負的要素と準委任的要素が併存することが多い。
契約類型が曖昧なままでは、成果物の完成責任、検収、瑕疵・契約不適合責任、善管注意義務、途中解約、追加費用、権利帰属、秘密保持、再委託、削除義務の解釈が不安定になる。AI開発では、最終的な精度や性能がデータ量、データ品質、特徴量、評価指標、外部環境に依存するため、通常のシステム開発以上に、契約段階で「何を完成とするか」を定義する必要があります。
このページでいうデータとは、電子的方法により記録・処理される情報一般をいう。ただし、契約実務では「データ」と一括りにせず、少なくとも次のように分類する。
次の表は、直前の内容を比較して整理したものです。読者にとって重要なのは、列ごとの違いから契約・運用上の確認点を具体化できる点です。左列から順に対象、条件、注意点を確認してください。
| 区分 | 例 | 権利整理上の論点 |
|---|---|---|
| 提供データ | 発注者がベンダーに提供する顧客データ、取引履歴、製造ログ、画像、音声、文書 | 利用目的、委託範囲、個人情報、営業秘密、第三者提供、再委託、返却・削除 |
| 収集データ | 委託業務の中で新たに取得するセンサーデータ、ユーザー行動ログ、テストデータ | 取得主体、利用目的、本人同意、プライバシー通知、帰属・利用権 |
| 加工データ | クレンジング後データ、正規化データ、匿名加工・仮名加工、特徴量 | 元データとの関係、再識別リスク、利用制限、秘密性 |
| 学習用データセット | モデル学習用に整形したデータ、教師ラベル、検証用データ | 著作権、営業秘密、限定提供データ、再利用、ベンチマーク利用 |
| 派生データ | 分析結果、統計値、スコア、予測値、クラスタリング結果 | 発注者専用か、ベンダー再利用可か、個人関連情報・営業秘密該当性 |
| 評価データ | テストセット、正解データ、評価ログ、性能比較表 | モデル品質保証、監査証跡、第三者検証、秘密保持 |
| 運用ログ | 入出力ログ、プロンプト、ユーザー指示、推論履歴 | 個人情報、秘密情報、モデル改善利用、監査、削除、保存期間 |
AIモデルも一枚岩ではありません。契約上は、少なくとも次の構成要素を分けるべきです。
次の表は、直前の内容を比較して整理したものです。読者にとって重要なのは、列ごとの違いから契約・運用上の確認点を具体化できる点です。左列から順に対象、条件、注意点を確認してください。
| 構成要素 | 内容 | 契約上の扱い |
|---|---|---|
| ソースコード | 学習、前処理、推論、評価、MLOpsに使うコード | 著作権、OSS、既存コード、納品・改変権 |
| アーキテクチャ | モデル構造、ネットワーク設計、アルゴリズム選定 | ノウハウ、特許、営業秘密、一般知識との境界 |
| ハイパーパラメータ | 学習率、層数、バッチサイズ等 | ノウハウ、再現性、モデル再学習時の必要情報 |
| 学習済み重み | 学習によって得られたパラメータ | 契約上の利用権、営業秘密、複製・提供・改変制限 |
| ベースモデル | 既存の大規模言語モデル、画像モデル、OSSモデル、商用API | 第三者利用規約、ライセンス、移転不能性 |
| ファインチューニング成果 | 発注者データで調整した追加重み、LoRA等 | 発注者データとの結合、利用範囲、再利用制限 |
| RAG構成物 | ベクトルDB、埋め込み、検索インデックス、プロンプトテンプレート | 元文書の権利、秘密情報、削除、更新、移行 |
| 評価・安全性資料 | モデルカード、データシート、テスト結果、リスク評価 | 説明責任、監査、M&A、当局・顧客説明 |
AIモデルの「所有」を一言で定めても、発注者が本当に必要とする運用権限が得られるとは限らない。たとえば、モデルの重みを受け取っても、前処理コード、特徴量定義、評価データ、推論環境、ライセンス、GPU環境、モデル更新手順がなければ、事業継続は困難です。逆に、ベンダーがモデルの権利を保持しても、発注者データを他社案件に使う権限まで当然に得るわけではありません。
AI生成物・出力とは、AIシステムが生成する文章、画像、音声、コード、分類結果、予測値、推薦結果、要約、議事録、設計案等をいう。出力の法的評価は、入力、プロンプト、モデル、生成過程、利用場面、既存著作物との類似性・依拠性、人間の創作的関与の有無により変わる。文化庁は、AI生成物について、人間の創作的寄与があるかどうか等を個別具体的に判断する考え方を示している。
データ、モデル、ログ、第三者素材を行為単位で整理します。
従来の業務委託では、納品物が報告書、システム、図面、広告物、ソフトウェア、ウェブサイトなど比較的把握しやすいものだった。しかし、AI・データ案件では、価値の中心が「学習過程」「データ処理手順」「モデル重み」「評価データ」「運用ログ」「改善ノウハウ」に移る。これらは画面上の成果物として見えにくく、契約書では「成果物」「納品物」「本件システム」などの抽象語に吸収されやすい。
その結果、納品後に次のような紛争が起こる。
契約書で「成果物の知的財産権は発注者に帰属する」と定めても、それだけで次の権限が明確になるわけではありません。
実務では、「帰属」を決めるだけでは不十分です。むしろ、利用目的、利用主体、利用期間、利用地域、複製・改変・再学習・再提供の可否、第三者利用、対価、監査、削除、証跡保存を具体的に決めるべきです。
著作権法は、思想または感情の創作的表現を保護する制度であり、単なる事実、数値、アイデア、ありふれたデータ自体を広く保護する制度ではありません。もっとも、データベースの情報の選択または体系的構成に創作性がある場合、データベースの著作物として保護され得る。また、データ処理プログラム、レポート、設計書、UI、説明文には著作物性が認められる場合がある。
データ保護の実務では、著作権だけでなく、秘密保持契約、アクセス制御、不正競争防止法上の営業秘密、限定提供データ、個人情報保護法、契約上の利用制限を組み合わせる必要があります。経済産業省も、価値あるデータであっても著作権法の保護対象となりません場合や、他者との共有を前提とするため営業秘密に該当しない場合に、不正流通を差し止めることが困難であったという背景を示し、限定提供データ制度を説明している。
データ、モデル、ログ、第三者素材を行為単位で整理します。
データやAIモデルの権利整理において、最も実務的に重要なのは契約です。契約は、法定の知的財産権が成立しない情報についても、当事者間の利用制限、秘密保持、再委託制限、返却・削除、監査、損害賠償、差止め、利用停止を定められる。
契約で整理すべき典型的な権限は次のとおりです。
次の表は、直前の内容を比較して整理したものです。読者にとって重要なのは、列ごとの違いから契約・運用上の確認点を具体化できる点です。左列から順に対象、条件、注意点を確認してください。
| 権限 | 内容 | 契約での確認事項 |
|---|---|---|
| 利用 | 業務遂行、運用、保守、研究、改善、営業提案等 | 目的、主体、期間、地域、媒体 |
| 複製 | データ・モデル・コードのコピー | バックアップ、検証環境、再委託先保有分 |
| 改変 | コード改修、再学習、追加学習、特徴量変更 | 誰ができるか、改変後の権利、品質保証 |
| 提供 | グループ会社、顧客、第三者ベンダーへの提供 | 第三者提供、再委託、秘密保持、個人情報 |
| 商用化 | SaaS化、API提供、パッケージ化、横展開 | 収益配分、独占・非独占、競業制限 |
| 再利用 | ベンダーが他案件に利用 | 発注者データの利用可否、匿名化、統計化 |
| 削除 | 契約終了時の消去 | 証明書、バックアップ、ログ、法令保存例外 |
| 監査 | データ利用、セキュリティ、再委託先管理 | 監査頻度、資料提出、オンサイト、費用負担 |
著作権の観点では、少なくとも次を分ける必要があります。
文化庁の資料は、AIと著作権について、柔軟な権利制限規定、学習段階、生成・利用段階、AI生成物の著作物性、侵害判断等を整理している。業務委託契約では、特に次の条項が重要です。
ただし、著作権譲渡条項を入れても、データ自体、モデル重み、ノウハウ、営業秘密、個人情報、第三者API規約の問題は解決しない。著作権条項は必要だが、それだけではAI・データ案件の権利整理としては不十分です。
AI関連技術は、一定の要件を満たせば特許の対象となり得る。特許庁はAI関連技術に関する特許審査事例を公表しており、AI関連発明の記載要件、進歩性、発明該当性等の検討に用いられている。
業務委託でAIモデルを開発する場合、特許法上の発明が生まれ得る場面は多い。
発明が生じた場合、重要なのは「誰が発明者か」です。発明者は自然人であり、会社やAIシステムそのものではありません。発注者担当者、ベンダー担当者、研究者、外部アドバイザーが共同で技術的創作に寄与した場合、共同発明となる可能性がある。ベンダー従業員の職務発明については、ベンダー社内の職務発明規程・契約も関係する。特許庁は、職務発明制度について、発明者です従業者等と使用者等の利益調整の制度として説明している。
契約では、次を定めるべきです。
データ・AIモデルの実務では、不正競争防止法が非常に重要です。営業秘密として保護されるには、一般に、秘密として管理されていること、有用な技術上または営業上の情報ですこと、公然と知られていないことが必要です。経済産業省は、営業秘密管理指針について、営業秘密として法的保護を受けるために必要となる最低限の水準の対策を示すものと説明している。
AIモデルの重み、学習データセット、特徴量、評価データ、顧客スコアリングロジック、リスク判定ロジック、チューニングノウハウは、秘密管理が適切であれば営業秘密として保護され得る。もっとも、単にNDAを締結しただけでは足りない場合がある。アクセス制御、秘密表示、ログ管理、権限管理、持出制限、教育、退職者管理、委託先監督、再委託先管理が必要です。
限定提供データは、業として特定の者に提供する情報として電磁的方法により相当量蓄積され、管理されている技術上または営業上の情報を保護する制度です。経済産業省は、限定提供データの三要件として、限定提供性、相当蓄積性、電磁的管理性を説明している。複数企業に提供するデータ連携基盤、産業データ、センサーデータ、購買データ、地図データ等では、この制度の検討が重要になる。
契約では、営業秘密と限定提供データを区別して、次の管理条項を設計する。
業務委託で個人データを扱う場合、発注者は個人情報取扱事業者としての責任を免れない。個人情報保護委員会の通則ガイドラインは、個人データの取扱いを委託する場合に、委託先に対して必要かつ適切な監督を行わなければなりませんこと、委託先の選定、委託契約の締結、委託先における取扱状況の把握等を説明している。
AI・データ案件では、個人情報保護上の論点が複雑化する。
個人情報保護委員会は、生成AIサービス利用に関する注意喚起も公表している。企業が生成AIや外部LLMを使って委託業務を行う場合、契約上「生成AI利用禁止」とするだけではなく、どのサービスを、どのデータ範囲で、どの設定で、誰が、どのログ保存条件で使うかを具体的に定める必要があります。
AI法やAI事業者ガイドラインは、個別のモデル所有権を直接決める契約法ではありません。しかし、AIの研究開発・活用を推進しつつ、リスクに対応するための政策・ガバナンスの文脈を示す。内閣府は、AI法について、AIのイノベーションを促進しつつリスクに対応するため、2025年6月4日に公布・一部施行され、同年9月1日に全面施行されたと説明している。経済産業省は、AI事業者ガイドライン第1.2版を2026年4月1日に最終更新している。
企業法務の観点では、AIガバナンスは契約条項に落とし込む必要があります。たとえば、AI開発委託では、権利帰属だけでなく、次の文書・証跡を成果物に含めることが望ましい。
データ、モデル、ログ、第三者素材を行為単位で整理します。
AI・データ業務委託契約では、まず「バックグラウンド資産」と「フォアグラウンド資産」を分ける。
バックグラウンド資産とは、契約締結前から当事者が保有していた資産、または本件業務とは独立して保有・開発していた資産をいう。
発注者側のバックグラウンド資産の例 ―
ベンダー側のバックグラウンド資産の例 ―
バックグラウンド資産は、原則として各当事者に留保するのが実務上自然です。ただし、相手方が成果物を利用するために必要な範囲で、非独占的利用許諾を付与する必要があります。ここを定めないと、発注者は納品物を受け取っても、ベンダー既存コードや既存モデルのライセンスがないため実運用できないという事態が起こる。
フォアグラウンド資産とは、本件業務の遂行により新たに作成、生成、収集、加工、開発された資産をいう。
例 ―
フォアグラウンド資産は、発注者帰属、ベンダー帰属、共同帰属、発注者への独占利用許諾、発注者への非独占利用許諾、ベンダー再利用可、ベンダー再利用不可など、複数の設計があり得る。
実務では、次の原則が有効です。
次の判断の流れは、資産を棚卸しして契約別紙に落とす順序を示します。読者にとって重要なのは、既存資産の留保と成果物利用に必要な許諾を同時に見て、終了時の移行・削除まで先に決めることです。上から下へ確認すると、交渉で詰まりやすい箇所が見えます。
データ、コード、モデル、ログ、資料、外部サービス、ノウハウを一覧化します。
契約前から当事者が保有していたものは原則として各当事者に留保します。
発注者が事業継続に使うため必要な範囲で、既存資産の利用許諾を定めます。
新規コード、データセット、追加重み、評価資料、ログを別紙で区分します。
返却、削除、削除証明、第三者保守、M&A時承継、監査証跡を契約に入れます。
データ、モデル、ログ、第三者素材を行為単位で整理します。
以下は、業務委託で生まれるデータ・AIモデル関連資産について、法的性質、典型リスク、契約対応を整理した実務マトリクスです。
次の表は、直前の内容を比較して整理したものです。読者にとって重要なのは、列ごとの違いから契約・運用上の確認点を具体化できる点です。左列から順に対象、条件、注意点を確認してください。
| 資産 | 主な法的性質 | 典型リスク | 契約対応 |
|---|---|---|---|
| 発注者提供データ | 個人情報、営業秘密、限定提供データ、契約上の秘密情報 | 目的外利用、漏えい、再委託、外国移転、自社モデル改善利用 | 利用目的限定、再利用禁止、委託先監督、返却削除、監査、ログ保存 |
| 第三者提供データ | ライセンス、著作権、データ利用規約 | 学習利用禁止、再配布禁止、商用利用禁止、権利侵害 | 由来確認、ライセンス表明保証、利用範囲、違反時補償 |
| 収集データ | 個人情報、個人関連情報、営業情報 | 取得時通知不足、同意不足、目的外利用 | 取得主体、利用目的、プライバシー通知、本人対応 |
| ラベル・アノテーション | 著作物性がある場合、業務成果物、ノウハウ | 作業者の権利、品質不良、再利用範囲不明 | 権利譲渡または利用許諾、品質基準、検収、再利用制限 |
| 前処理済みデータ | 派生データ、秘密情報、場合によりデータベース | 元データ制限の潜脱、再識別、発注者競争情報流出 | 元データと同等管理、利用範囲、匿名化基準、削除義務 |
| 学習用データセット | データベース、営業秘密、限定提供データ、契約上の成果物 | 納品対象外、再学習不能、他社案件流用 | 帰属・利用権、納品範囲、第三者提供可否、保存期間 |
| 評価データ・正解データ | 秘密情報、ノウハウ | 精度検証不能、ベンダー依存、恣意的評価 | 評価指標、評価手順、データ分割、監査可能性 |
| ソースコード | 著作権、OSS、営業秘密 | 既存コード混入、OSS違反、改変不可 | 著作権譲渡/許諾、OSS一覧、ソース納品、改変権 |
| モデルアーキテクチャ | ノウハウ、営業秘密、特許可能性 | 重要技術の帰属不明、模倣、出願争い | 発明届出、ノウハウ利用、秘密管理、共同出願条項 |
| 学習済み重み | 契約上の資産、営業秘密、ベースモデル規約の制約 | 発注者が持ち出せない、ベンダーが他社流用 | 帰属/利用許諾、複製・改変・提供、終了時移行 |
| ファインチューニング成果 | 発注者データとベンダー技術の混合物 | ベースモデル規約違反、再利用範囲不明 | 追加重みの権利、基盤モデル条件、分離可能性 |
| RAG用ベクトルDB | 元文書権利、秘密情報、個人情報 | 元データ削除後も情報残存、移行不能 | 元文書連動削除、埋め込みの扱い、検索ログ管理 |
| プロンプトテンプレート | ノウハウ、場合により著作物 | ベンダー再利用、営業秘密流出 | 帰属、再利用範囲、秘密情報指定 |
| AI出力 | 著作権、第三者権利侵害リスク、契約上の成果物 | 既存著作物類似、虚偽、差別、個人情報混入 | 利用条件、レビュー義務、表明保証、責任分担 |
| 運用ログ | 個人情報、秘密情報、監査証跡 | 過剰保存、漏えい、学習利用、削除漏れ | 保存期間、利用目的、マスキング、監査、削除証明 |
| モデルカード・評価資料 | 文書著作物、説明責任資料 | 非納品、監査不可、M&A評価不能 | 成果物化、更新義務、開示範囲、保管義務 |
| 一般ノウハウ | ベンダー技術、発注者業務知識 | 過度な拘束、競業制限、流用 | 相互留保、秘密情報との線引き、再利用許容範囲 |
データ、モデル、ログ、第三者素材を行為単位で整理します。
データ分析委託では、ベンダーが発注者データを受け取り、分析レポート、ダッシュボード、予測モデル、統計結果を作成する。ここでは、発注者データの目的外利用と、派生データの再利用が最大の論点です。
発注者としては、次を明記すべきです。
ベンダーとしては、汎用的な分析手法、既存コード、テンプレート、一般的知見まで発注者に譲渡しないよう、バックグラウンド資産として留保する必要があります。
AIモデル開発委託では、モデルの権利整理を「学習済みモデルは誰のものか」という一文で済ませてはなりません。次を分けるべきです。
発注者が自社事業の中核としてモデルを長期利用するなら、少なくとも次の権限が必要です。
一方、ベンダーがSaaS型で提供し、発注者はAPI利用だけで足りる場合は、モデル重みの譲渡を求める必要はない。この場合は、SLA、データ利用制限、障害時対応、料金改定、終了時移行、ログ削除、モデル変更時の通知、性能劣化時の対応を重点的に定める。
生成AI導入では、ベースモデルを一から開発するよりも、商用LLMやOSSモデルを使い、ファインチューニングまたはRAGを構築することが多い。
ファインチューニングでは、発注者データがモデルの追加重みに影響を与える。契約上は、追加重みが誰に帰属するか、ベースモデルと分離して利用できるか、ベンダーが他社案件に使えるかを定める必要があります。
RAGでは、元文書、埋め込みベクトル、検索インデックス、プロンプトテンプレート、回答生成ログが重要です。元文書を削除しても、ベクトルDBやログに情報が残る場合がある。したがって、終了時・削除請求時・誤登録時に、元文書、チャンク、埋め込み、インデックス、キャッシュ、ログを連動して削除できる設計が必要です。
AI案件では、PoC段階では成果物の完成責任を重く設定せず、探索的な準委任に近い形で進めることが多い。しかし、PoCで作成したデータセット、前処理コード、モデル、評価結果、ノウハウが本番開発の基礎になる場合、PoC契約の権利条項が不十分だと本番移行で詰まる。
PoC契約でも、最低限、次を定めるべきです。
大学、研究機関、複数企業、スタートアップとの共同開発では、成果物が共同で生まれる可能性が高い。共同著作、共同発明、共有特許、共有ノウハウ、共同保有データは、後の商用化で制約になりやすい。
共同開発契約では、次を明確にする。
AI・データ案件では、データサイエンティスト、アノテーター、プロンプトエンジニア、エンジニア、デザイナー、リサーチャーを個人に委託することがある。この場合、フリーランス・事業者間取引適正化等法への対応が必要となる場合がある。公正取引委員会のQ&Aは、業務委託の成果物に知的財産権が発生する場合、権利の譲渡・許諾の範囲を明確に記載する必要があり、権利の対価を報酬に加える必要がありますと説明している。
発注者は、個人委託の場合こそ、「成果物はすべて当社に帰属する」という一方的な雛形を安易に使わず、譲渡・許諾の範囲、二次利用、報酬、納品物、検収、秘密保持、個人情報、生成AI利用、OSS利用を具体化すべきです。
次の一覧は、契約類型ごとに重点が変わる論点を整理したものです。読者にとって重要なのは、データ分析、モデル開発、RAG、PoC、共同開発、個人委託を同じ雛形で処理しないことです。各類型で厚く確認すべき契約項目を読み取ってください。
提供データの目的外利用と派生データの再利用が中心です。分析レポート、コード、前処理手順、データ辞書を納品対象にするかを定めます。
提供データベースモデル、学習コード、前処理コード、学習データセット、追加重み、推論API、評価資料、再学習手順を分けます。
モデル構成PoC不採用時の削除、本番移行時の権利承継、検証目的、評価指標、報告義務を最初から定めます。
PoC共同発明、共同著作、論文発表、特許出願、研究者・学生・外部協力者の権利処理を明確にします。
共同開発知的財産権が発生する場合、譲渡・許諾の範囲と対価、生成AI利用、OSS利用、秘密保持を具体化します。
個人委託データ、モデル、ログ、第三者素材を行為単位で整理します。
以下は、AI・データ業務委託契約で最低限検討すべき条項です。実際の条項は案件に応じて調整する。
定義条項は、権利整理の土台です。特に、「成果物」「データ」「本件モデル」「提供データ」「派生データ」「学習データ」「評価データ」「ログ」「秘密情報」「第三者素材」「ベースモデル」「本件利用目的」を定義する。
条項例
本契約において「本件データ」とは、甲が乙に提供するデータ、乙が本業務の遂行過程で収集または生成するデータ、当該データを加工、変換、統合、抽出、分析または学習用に整形したデータ、ならびに本件モデルの学習、評価、運用に関連して記録されるログをいう。ただし、乙が本契約締結前から保有する汎用的データおよび第三者から適法に取得したデータを除く。
目的 ― 委託前から各当事者が保有する資産を相手方に奪われないようにしつつ、成果物利用に必要な範囲でライセンスを与える。
条項例
各当事者が本契約締結前から保有し、または本業務とは独立して開発、取得もしくは保有するデータ、ソフトウェア、AIモデル、ノウハウ、発明、著作物その他の知的財産および情報資産に関する権利は、当該当事者に留保される。
乙は、甲が本成果物を本件利用目的の範囲で利用するために必要な限度で、乙バックグラウンド資産について、非独占的、譲渡不能、再許諾不可の利用権を甲に許諾する。ただし、別紙においてグループ会社利用、第三者保守委託、事業譲渡時の承継、再許諾を認める場合はこの限りでない。
目的 ― 発注者データの目的外利用、自社モデル改善利用、他社案件流用を防ぐ。
条項例
乙は、甲提供データを本業務の遂行および本成果物の作成の目的に限り利用するものとし、甲の事前の書面承諾なく、乙または第三者のAIモデル、アルゴリズム、サービス、データベース、分析基盤の学習、改善、評価、ベンチマーク、研究開発、営業提案または他案件のために利用してはなりません。
目的 ― ベンダーが「匿名化」「統計化」を理由に自由利用することを防ぐ一方、合理的なサービス改善を許す場合の条件を設定する。
条項例
乙は、本件データから生成される加工データ、派生データ、統計データまたは分析結果を、甲の競争上重要な情報、個人情報、個人関連情報、営業秘密または限定提供データを推知可能な態様で利用または第三者提供してはなりません。
乙がサービス品質改善のために統計情報を利用する場合、当該統計情報は、特定の個人、法人、事業所、製品、取引先または甲の業務上の秘密を識別または推知できない形式に不可逆的に加工されたものに限る。
目的 ― モデルを構成要素ごとに分け、帰属・利用権・納品範囲・再利用可否を決める。
条項例
本件モデルは、別紙に定める区分に従い、(1)乙既存モデル、(2)第三者モデル、(3)本件学習済みモデル、(4)追加学習済み重み、(5)前処理・推論・評価コード、(6)モデルカードおよび評価資料に分類する。
本件学習済みモデルおよび追加学習済み重みの権利帰属、利用範囲、複製、改変、再学習、第三者提供、再許諾、契約終了後の利用、再委託先への開示、グループ会社利用、事業譲渡時の承継については、別紙「AIモデル権利一覧」に定める。
目的 ― 最も紛争が多い「ベンダーが発注者データを学習に使えるか」を明確にする。
選択肢は大きく三つある。
次の表は、直前の内容を比較して整理したものです。読者にとって重要なのは、列ごとの違いから契約・運用上の確認点を具体化できる点です。左列から順に対象、条件、注意点を確認してください。
| 選択肢 | 内容 | 向いている場面 |
|---|---|---|
| 完全禁止 | 発注者データをベンダーの汎用モデル改善に使わない | 個人情報、営業秘密、競争上重要データ |
| 限定許諾 | 匿名化・統計化、目的限定、監査付きで許す | SaaS改善、品質改善、非競争領域 |
| 広範許諾 | ベンダーが研究開発・モデル改善に使える | 発注者が低価格や共同研究メリットを得る場合 |
禁止型条項例
乙は、甲提供データ、甲派生データ、本件ログおよび本件成果物を、乙または第三者の汎用AIモデル、基盤モデル、推奨モデル、分類モデル、生成AIモデルその他のAIシステムの学習、追加学習、ファインチューニング、評価、改善または検証に利用してはなりません。
限定許諾型条項例
前項にかかわらず、乙は、甲の事前承諾を得た場合に限り、別紙に定める範囲で、甲を識別できず、かつ甲の営業秘密、個人情報、個人関連情報、限定提供データまたは競争上重要な情報を推知できない統計情報を、乙サービスの品質改善目的で利用できる。
目的 ― 委託先監督、再委託、外国移転、生成AI入力、ログ管理を契約に落とす。
条項例
乙は、個人データを、甲の指示および本契約に定める目的の範囲内でのみ取り扱うものとし、甲の事前承諾なく、個人データを第三者に提供し、再委託し、または外国にある第三者に取り扱わせてはなりません。
乙は、生成AIサービス、外部LLM、クラウドAI APIその他の外部AIサービスに、個人データ、秘密情報または甲が指定するデータを入力してはなりません。ただし、甲がサービス名、提供者、所在国、学習利用設定、ログ保存条件、再委託構造、安全管理措置を確認し、書面で承諾した場合を除く。
目的 ― OSS、商用LLM、第三者データセット、外部APIの制限を管理する。
条項例
乙は、本成果物に第三者のソフトウェア、OSS、AIモデル、データセット、API、ライブラリ、素材またはサービスを利用する場合、事前に当該第三者素材の名称、バージョン、ライセンス、利用条件、再配布可否、商用利用可否、ソース開示義務、学習利用制限、国外移転、サポート終了日を記載した一覧を甲に提出する。
AI案件では、性能が不確実ですため、納品物と検収基準を具体化する必要があります。
納品対象例 ―
検収基準は、「精度99%」のような単純な表現ではなく、データ条件、評価期間、評価指標、閾値、対象外条件、再評価手順、ドリフト時対応を定める。
契約終了時の処理は、最初に決めておくべきです。
条項例
乙は、本契約終了後、甲の選択に従い、甲提供データ、本件学習データ、本件ログ、本件モデル、本成果物およびこれらの複製物を返却または削除し、削除完了後、削除証明書を提出する。ただし、法令上保存が必要な記録、紛争対応に必要な最小限の証跡、または本契約上乙の継続利用が明示的に認められた情報については、当該保存目的に必要な範囲に限り保存できる。
データ、モデル、ログ、第三者素材を行為単位で整理します。
発注者は、事業継続、競争優位、個人情報保護、監査、M&Aを重視する。特に次を確認する。
ベンダーは、既存技術、汎用ノウハウ、再利用可能性、過大責任の回避を重視する。特に次を確認する。
データ、モデル、ログ、第三者素材を行為単位で整理します。
問題点 ― 何が成果物か不明です。ベンダー既存技術まで含むのか、モデル重み、学習データ、ログ、評価資料、ノウハウまで含むのか不明です。
修正方針 ― 成果物を別紙一覧化し、権利帰属・利用権・納品有無・再利用可否を項目ごとに定める。
問題点 ― 本件業務のAI開発だけか、乙の汎用モデル改善も含むのか、他社案件も含むのか不明です。
修正方針 ― 「本業務遂行のための利用」と「乙のモデル改善利用」を明確に分ける。
問題点 ― 匿名化の定義が不明です。個人情報保護法上の匿名加工情報か、単なるマスキングか、統計化か不明であり、営業秘密や競争情報が残る可能性がある。
修正方針 ― 匿名加工、仮名加工、統計化、不可逆加工、再識別禁止、競合提供禁止、監査権を定める。
問題点 ― 利用範囲が不明です。契約終了後、グループ会社利用、第三者委託、改変、再学習、事業譲渡時承継ができるか不明です。
修正方針 ― 利用主体、目的、期間、地域、改変、再学習、再許諾、承継、終了時移行を明記する。
問題点 ― AI出力や第三者データセットでは、ベンダーがすべてを保証できない場合がある。過大保証は価格や契約成立性に影響する。
修正方針 ― ベンダーが管理可能な範囲、発注者提供データに起因する範囲、外部モデル規約に起因する範囲を分け、侵害申立時の協力・代替措置・利用停止・補償を定める。
データ、モデル、ログ、第三者素材を行為単位で整理します。
個人情報や機密情報を含む場合、まず「AI開発に本当に必要なデータか」を検討する。全量データをベンダーに渡すのではなく、必要最小限の項目、期間、サンプル、マスキング、仮名化、匿名加工、オンプレミス処理、セキュア環境、アクセス制限を検討する。
個人データの取扱いを委託する場合、発注者は委託先の選定、委託契約、取扱状況の把握、再委託管理を行う必要があります。AI案件では、ベンダーだけでなく、クラウド事業者、LLM提供者、アノテーション会社、海外開発拠点、MLOpsツール提供者も関係する。
委託業務で生成AIを使う場合、契約または別紙で次を定める。
AI運用ログは、品質改善、監査、事故調査に必要です一方、個人情報、営業秘密、顧客相談内容、機密文書、プロンプトインジェクションの痕跡を含む可能性がある。ログは「保存しない」ではなく、何を、どの期間、誰が、どの目的で保存し、どのようにマスキング・削除するかを決める。
データ、モデル、ログ、第三者素材を行為単位で整理します。
AI・データ資産は、M&A、IPO、資金調達、事業譲渡、ライセンス監査で厳しく確認される。デューデリジェンスでよく問われるのは次の事項です。
権利整理が不十分なAIモデルは、技術的に優れていても、法務DDでは「利用権限が不明な資産」と評価され、企業価値を下げる可能性がある。AI資産は、コードリポジトリだけでなく、契約、ライセンス、データ台帳、モデル台帳、監査ログと一体で管理する必要があります。
データ、モデル、ログ、第三者素材を行為単位で整理します。
業務委託で生まれたデータ・AIモデルは、会計・税務上も整理が必要です。たとえば、開発費、研究開発費、ソフトウェア資産、無形資産、ライセンス料、保守費、クラウド利用料、知財譲渡対価、ロイヤルティ、グループ会社間利用料、移転価格税制などが関係し得る。
法務契約で「すべて委託料に含む」と書いても、会計・税務上の処理が自動的に決まるわけではありません。発注者がAIモデルやデータセットを資産として利用・譲渡・ライセンスする予定がある場合は、契約段階で経理、税務、会計監査人、CFO、事業部、法務が連携する必要があります。
調達面では、知的財産権やデータ利用権を広く取得する場合、その対価を報酬に含めるか別建てにするかを明確にすべきです。フリーランスや中小受託事業者との取引では、権利譲渡・許諾の範囲と対価を不明確にすると、取引適正化上の問題を生じ得る。
データ、モデル、ログ、第三者素材を行為単位で整理します。
AI・データ案件の紛争では、口頭説明よりもログと証跡が重要になる。典型的な紛争は次のとおりです。
証拠として重要なものは次のとおりです。
デジタルフォレンジックの観点では、紛争発生後にログを改変・削除しないこと、証拠保全の範囲を早期に決めること、クラウドログの保存期間を把握することが重要です。
データ、モデル、ログ、第三者素材を行為単位で整理します。
次の時系列は、チェックリストをいつ使うかを整理したものです。読者にとって重要なのは、契約締結時だけでなく、データ追加やモデル変更、終了・移行時にも再確認が必要になる点です。順番に読むと、証跡を残すべきタイミングが分かります。
利用するデータ、個人情報該当性、第三者データ、外部AIサービス、納品物候補を整理します。
コード、データセット、追加重み、評価資料、ログ、外部素材一覧を別紙で管理します。
第三者保守、グループ会社利用、削除証明、バックアップ処理、証跡保存を確認します。
データ、モデル、ログ、第三者素材を行為単位で整理します。
「業務委託で生まれたデータ・AIモデルの権利整理」は、法務部だけの仕事ではありません。主な役割は次のとおりです。
次の表は、直前の内容を比較して整理したものです。読者にとって重要なのは、列ごとの違いから契約・運用上の確認点を具体化できる点です。左列から順に対象、条件、注意点を確認してください。
| 担当 | 主な確認事項 |
|---|---|
| 法務担当・企業内弁護士 | 契約類型、権利帰属、利用許諾、責任制限、紛争対応 |
| 外部弁護士 | 複雑案件、紛争、M&A、クロスボーダー、当局対応 |
| 知財法務担当・弁理士 | 著作権、特許、職務発明、OSS、商標、ノウハウ管理 |
| 個人情報保護・プライバシー担当 | 個人情報、委託先監督、外国移転、プライバシー通知 |
| CISO・セキュリティ担当 | アクセス制御、暗号化、ログ、インシデント対応 |
| データサイエンティスト・MLエンジニア | データ分割、モデル構成、評価、再現性、MLOps |
| 調達担当 | 委託条件、対価、取引適正化、ベンダー管理 |
| 経理・税務・公認会計士・税理士 | 資産計上、費用処理、ライセンス料、移転価格 |
| 内部監査・内部統制担当 | 権限管理、証跡、規程遵守、監査可能性 |
| 経営層・取締役 | 事業リスク、AIガバナンス、投資判断、説明責任 |
データ、モデル、ログ、第三者素材を行為単位で整理します。
一般的には、いいえ。委託料の支払いだけで、データ、AIモデル、ソースコード、学習済み重み、ベンダー既存ノウハウ、第三者モデルの権利が当然に発注者へ移転するわけではありません。契約で、何を譲渡し、何を利用許諾し、何をベンダーに留保するかを定める必要があります。 ただし、契約条件、運用実態、証拠関係、時期によって結論が変わる可能性があります。具体的な対応は、資料を整理したうえで専門家へ相談する必要があります。
一般的には、不十分です。成果物の範囲、バックグラウンド資産、派生データ、学習データ、モデル重み、ログ、評価資料、プロンプト、ノウハウ、第三者素材を分けなければなりません。 ただし、契約条件、運用実態、証拠関係、時期によって結論が変わる可能性があります。具体的な対応は、資料を整理したうえで専門家へ相談する必要があります。
一般的には、単なる事実、数値、アイデアとしてのデータ自体は通常、著作権で保護されない。ただし、データベースの選択・体系的構成、プログラム、文書、画像、ラベル付けの表現などには著作権が成立し得る。 ただし、契約条件、運用実態、証拠関係、時期によって結論が変わる可能性があります。具体的な対応は、資料を整理したうえで専門家へ相談する必要があります。
一般的には、一概にはいえない。モデル重みについては、著作権だけでなく、契約上の利用制限、営業秘密、限定提供データ、ベースモデル規約、秘密保持により実務上の保護を設計することが重要です。 ただし、契約条件、運用実態、証拠関係、時期によって結論が変わる可能性があります。具体的な対応は、資料を整理したうえで専門家へ相談する必要があります。
一般的には、契約で明示的に許され、かつ個人情報保護法、秘密保持義務、第三者データ利用条件、営業秘密管理、競争上の制約に反しない場合に限られる。契約に何も書かれていない場合、安易に利用すべきではありません。 ただし、契約条件、運用実態、証拠関係、時期によって結論が変わる可能性があります。具体的な対応は、資料を整理したうえで専門家へ相談する必要があります。
一般的には、必ずしもそうではありません。匿名加工情報、仮名加工情報、統計情報、単なるマスキングは異なる。さらに、個人情報でなくなっても、営業秘密、限定提供データ、契約上の秘密情報、競争情報として利用制限が残る場合がある。 ただし、契約条件、運用実態、証拠関係、時期によって結論が変わる可能性があります。具体的な対応は、資料を整理したうえで専門家へ相談する必要があります。
一般的には、サービス提供者、所在国、入力データの学習利用有無、ログ保存、再委託、セキュリティ、個人情報、出力の権利、利用規約、API設定、社内ポリシー、委託契約上の許可を確認する。 ただし、契約条件、運用実態、証拠関係、時期によって結論が変わる可能性があります。具体的な対応は、資料を整理したうえで専門家へ相談する必要があります。
一般的には、契約次第です。ただし、元文書の権利、秘密情報、個人情報、削除義務と連動させる必要があります。ベクトルDBや埋め込みに元文書由来の情報が残る場合、元文書を削除しただけでは十分でないことがある。 ただし、契約条件、運用実態、証拠関係、時期によって結論が変わる可能性があります。具体的な対応は、資料を整理したうえで専門家へ相談する必要があります。
一般的には、第三者著作物との類似、商標・肖像・パブリシティ、個人情報、虚偽情報、差別・バイアス、契約上の利用制限、業法規制が問題となり得る。出力をそのまま使うのではなく、用途に応じた人間のレビューが必要です。 ただし、契約条件、運用実態、証拠関係、時期によって結論が変わる可能性があります。具体的な対応は、資料を整理したうえで専門家へ相談する必要があります。
一般的には、少なくとも、(1)データ一覧、(2)AIモデル構成要素一覧、(3)成果物・納品物一覧、(4)第三者素材・OSS・外部モデル一覧、(5)個人情報・再委託一覧、(6)終了時返却削除一覧、(7)評価指標・検収基準一覧を作るべきです。 ただし、契約条件、運用実態、証拠関係、時期によって結論が変わる可能性があります。具体的な対応は、資料を整理したうえで専門家へ相談する必要があります。
一般的には、--- ただし、契約条件、運用実態、証拠関係、時期によって結論が変わる可能性があります。具体的な対応は、資料を整理したうえで専門家へ相談する必要があります。
データ、モデル、ログ、第三者素材を行為単位で整理します。
次の表は、直前の内容を比較して整理したものです。読者にとって重要なのは、列ごとの違いから契約・運用上の確認点を具体化できる点です。左列から順に対象、条件、注意点を確認してください。
| No | データ名 | 提供者 | 個人情報 | 営業秘密 | 第三者権利 | 利用目的 | ベンダー再利用 | 終了時処理 |
|---|---|---|---|---|---|---|---|---|
| 1 | 顧客購買履歴 | 発注者 | あり | あり | なし | 需要予測モデル開発 | 不可 | 返却・削除 |
| 2 | 商品マスタ | 発注者 | なし | あり | なし | 特徴量作成 | 不可 | 返却・削除 |
| 3 | 公開統計 | 第三者 | なし | なし | 利用規約あり | 補助特徴量 | 規約範囲内 | 継続可否確認 |
| 4 | 評価用正解データ | 共同作成 | 場合による | あり | なし | 性能評価 | 不可 | 発注者保有 |
次の表は、直前の内容を比較して整理したものです。読者にとって重要なのは、列ごとの違いから契約・運用上の確認点を具体化できる点です。左列から順に対象、条件、注意点を確認してください。
| No | 構成物 | 由来 | 権利帰属 | 発注者利用範囲 | ベンダー再利用 | 納品 | 終了後利用 |
|---|---|---|---|---|---|---|---|
| 1 | ベースモデル | 商用API | 提供者 | API規約範囲 | 該当なし | なし | 規約次第 |
| 2 | 前処理コード | ベンダー既存+新規 | 区分管理 | 本件目的で利用 | 既存部分可 | あり | 可 |
| 3 | 追加学習済み重み | 本件開発 | 発注者または独占許諾 | 本件・グループ利用 | 不可 | あり | 可 |
| 4 | 評価レポート | 本件作成 | 発注者 | 社内外説明に利用 | 匿名事例化のみ | あり | 可 |
| 5 | プロンプトテンプレート | 共同作成 | 別紙指定 | 本番運用 | 汎用部分のみ可 | あり | 可 |
次の表は、直前の内容を比較して整理したものです。読者にとって重要なのは、列ごとの違いから契約・運用上の確認点を具体化できる点です。左列から順に対象、条件、注意点を確認してください。
| No | 名称 | 種別 | 提供者 | ライセンス | 商用利用 | 再配布 | ソース開示義務 | 学習利用制限 | 備考 |
|---|---|---|---|---|---|---|---|---|---|
| 1 | OSSライブラリA | ソフトウェア | OSS | MIT | 可 | 可 | なし | なし | 著作権表示要 |
| 2 | モデルB | AIモデル | 外部提供者 | 商用規約 | 可 | 不可 | なし | 追加学習制限あり | API利用のみ |
| 3 | データセットC | データ | 第三者 | 個別契約 | 可 | 不可 | なし | 学習利用可否確認 | 契約書添付 |
データ、モデル、ログ、第三者素材を行為単位で整理します。
「業務委託で生まれたデータ・AIモデルの権利整理」は、単なる知的財産条項の問題ではありません。データ保護、個人情報保護、営業秘密管理、AIガバナンス、モデル運用、会計・税務、調達、監査、M&A、紛争対応まで含む、企業の情報資産ガバナンスそのものです。
実務上の最重要ポイントは、次の五つに集約される。
AI・データ案件の契約書は、技術の後追いで作る紙ではありません。むしろ、どのデータを使い、どのモデルを作り、誰がどこまで利用し、どのリスクを誰が負い、終了後にどのように事業を継続するかを定める設計図です。発注者とベンダーがこの設計図を共有して初めて、AI活用は法的にも事業的にも持続可能になる。
次の強調項目は、ページ全体の結論を一文で整理したものです。読者にとって重要なのは、AI・データ案件の契約を単なる成果物譲渡ではなく、情報資産の継続管理として設計する点です。この観点から、各条項の不足を確認してください。
どのデータを使い、どのモデルを作り、誰がどこまで利用し、どのリスクを誰が負い、終了後にどのように事業を継続するかを、発注者とベンダーが同じ設計図として共有することが重要です。