モデルとは
モデルとは、現実世界、抽象概念、またはデータの特徴を、特定の目的のために単純化・抽象化・定式化・具体化した表現のことです。
モデルは、現実世界と概念世界を結ぶ橋渡し
モデルは、根本的には現実世界と概念世界を結ぶ橋渡しの役割を果たす知的構築物です。
人間が複雑な現実を理解し、操作し、予測するための知的道具であり、現実と抽象の間を行き来するための概念的媒介物と言えます。
そしてこの定義は、下記の「モデル」の3つの類型を包括しています。
「モデル」が持つ3つの主要な側面
「非線形な世界」(大野克嗣 著 東京大学出版会)によれば、科学における「モデル」という言葉には、大きく次の三つの用法があります。
これらの側面は互いに排他的ではなく、多くの科学的モデルは文脈によって複数の側面を持ち合わせています。特定の「モデル」が主にどの側面に重点を置くかは、その目的や使用状況によって異なります。
① 本質抽出としてのモデル
現実のある側面(ある現象)の数理的本質を捉えることを目的とした「モデル」
一つ目は、イジングモデルや惑星系モデルのように現実の特定の現象の数理的本質をとらえるための簡潔な表現であり、対象の複雑さをある程度犠牲にしつつも数学的に本質的な部分を掴もうとするものです。
現実のある現象の数理的本質を捉え、理解を深めるためのモデルです。
② 代替・シミュレーションとしてのモデル
系のある側面の”あらゆる記述”を与えることで
実際の系のかわり(subsitute)になる(数理的あるいは実体的な)系としての「モデル」
二つ目は、ある実際の系に関する観測データを整理し、必要な記述を与えることでその系の代わりとして機能するタイプのモデルです。
いわゆる数値シミュレーションや原子力発電所の動作モデルなどが例に挙げられます。これは現象の理解よりもデータ圧縮や再現に重点があり、第一の用法ほど数理的本質を追究しようとはしません。
現実の系の詳細な記述やデータ圧縮を目的としたモデルです。
「系(けい)」とは
「系」という言葉は、一般的に「相互に関連する要素の集合」を指します。
文脈によって、「物理系」「生態系」「社会システム」のように言い換えられることもあり、単に「システム」と表現されることも多いです。
この文脈では、例えば「現実の系」は、「現実世界に存在する、あるいは実在の事象・要素・要因同士が互いに関連し合う全体」という意味になります。
つまり、
- 自然現象や物理現象の対象(例:流体力学で扱う流体の系、熱力学で扱う熱力学的系)
- 社会的・経済的な活動全般をひとまとまりとして捉えたもの(例:経済システム、社会システム)
- 生物の生態系や環境そのもの
など、あらゆる「対象を全体としてみなしたまとまり(システム)」が「系」に相当します。
「系の詳細な記述やデータ圧縮を目的としたモデル」というのは、そうした“現実に存在している複雑な対象・現象の集合”をできるだけ正確かつ簡潔に表現することを目的とするモデル、という意味合いになります。
③ 論証・構成としてのモデル
抽象的なもの(体系)をより具体的に表現した「モデル」
三つ目は、抽象的体系を具体的に表すモデルです。
幾何学におけるポアンカレの双曲幾何モデルや、計算可能性を示すチューリング機械などが該当します。
この場合は概念を証明や論証の道具として具体化したもので、現実世界との対応関係を問う必要がさほど生じないという点で一つ目や二つ目と異なります。
抽象的な概念を具体的に表現し、論証の道具として用いられるモデルです。
例えば、AIモデルや大規模言語モデル、基盤モデルなどは、上の三つの「モデル」のうち、どれも主として第二の用法に対応すると考えられます(ただし、いくつかの側面で例外や複合的な要素もあります)。
すなわち、観測データ(膨大なテキストや画像など)を取り込み、それらから得られた統計的あるいは特徴的パターンをもとに、実際のタスク(言語生成や分類など)を「置き換え」あるいは「再現」する機能を担うモデルということです。
第一のモデルのように「現象の数学的本質をコンパクトに示す」ことが主目的というよりは、むしろ大量の観測事実を圧縮し、必要な出力を(ある程度)忠実に生み出す、いわば「代替的(substitute的)」役割の方に重心があります。
もちろん、これらのモデルの開発にはさまざまな理論的枠組みや数理が用いられますが、それらは第三の「抽象体系を具体的に示す」ためのモデル(非ユークリッド幾何学の構成例など)とは異なり、主眼が「概念実証・論証」にあるわけではありません。
そのため、AIモデル・大規模言語モデル・基盤モデルはいずれも第二のモデルに近い位置づけといえます。
Iモデル、大規模言語モデル、基盤モデルは、主に二つ目の用法(現実の系の詳細な記述やデータ圧縮)に該当しますが、一つ目の用法(現実のある現象の数理的本質を捉える)や、間接的に三つ目の用法(抽象概念の具体化)に関連する側面も持っています。
特に、基盤モデルの研究が進むにつれて、一つ目の用法との関連性がより明確になる可能性があります。
様々な種類の「モデル」の分類・考察例
以下の表は、「モデル」を考える目的で、科学におけるモデルの三つの類型に基づいて、さまざまな種類のモデルを分類したものです。
各モデルは、
(1) 現象の数理的本質を捉える表現、
(2) 現実の精密な代替表現、
または
(3) 抽象的概念の具体的表現
のいずれか、あるいは複数の側面を持ちます。
繰り返しとなりますが、これらの側面は互いに排他的ではなく、多くの科学的モデルは文脈によって複数の側面を持ち合わせています。特定の「モデル」が主にどの側面に重点を置くかは、その目的や使用状況によって異なります。
科学的モデルの分類表
以下の表は、科学におけるモデルの三つの類型に基づいて、さまざまな種類のモデルを分類したものです。
各モデルは、(1) 現象の数理的本質を捉える表現、(2) 現実の精密な代替表現、または (3) 抽象的概念の具体的表現のいずれか、あるいは複数の側面を持ちます。
モデルの種類 | 主要な分類 | 副次的な分類 | 説明 |
人工知能(AI)関連モデル | |||
大規模言語モデル (LLM) | (2) | (1) | 大量データから学習し、現実の言語タスクを代替・再現することを主目的とするため、(2) に当たることが多い。 主に言語現象を再現・生成する精密な代替表現として機能するが、言語理解の研究では本質的側面の捉え方としても使用される。 言語の一般的構造を捉える可能性(1の側面)も。 |
基盤モデル (Foundation Model) | (2) | (1) | 多様なデータを事前学習して汎用タスクに適用するためのモデルであり、現象理解というよりは実際のタスク代替・再現に重きを置く。 様々なタスクに転用可能な汎用的な代替表現だが、認知や情報処理の本質的側面の研究にも用いられる。 より広範なタスクへの適応性を持つため、1の側面が強まる可能性も。 |
マルチモーダルモデル (Multimodal Model) | (2) | – | 複数形式(テキスト・画像・音声等)のデータを扱い、各種実応用を目指すため、現実の観測データを再現する立場が強い。 複数形式のデータを扱う実世界の精密な代替表現として機能する。 複数のデータ形式を扱うため、より複雑な記述が可能。 |
生成モデル (Generative Model) | (2) | (1) | データの分布を学習し、新しいデータを生成(記述の拡張)。 GANやVAEなど、観測データの分布を学習して新たなサンプルを生成するため、データの「生成源(代替)」としての役割が中心。 データの特徴分布を学習し新たなサンプルを生成する現実の代替表現として機能するが、データ生成過程の本質を捉える側面も持つ |
識別モデル (Discriminative Model) | (2) | – | 入力からカテゴリを予測するため、観測データに対して正しい出力を得ることが目的。 入力データを分類する精密な代替表現として主に機能する。 データの分類(記述の一形態)。 |
深層学習モデル (Deep Learning Model) | (2) | (1) | 多層のニューラルネットワークによるパターン学習であり、実世界データを再現・代替する応用が中心。 複雑なパターンを学習する代替表現だが、認知や知覚の本質的側面を研究する手段としても使われる。 複雑なパターン認識(主に2)だが、モデルの構造が現象の本質を捉える可能性(1)も。 |
強化学習モデル (Reinforcement Learning Model) | (2) | (1) | 環境との相互作用を模擬・再現し、最適方策を学習するモデル。 環境との相互作用の記述。 環境との相互作用を学習する代替表現だが、方策の学習が、ある種の最適化問題の本質を捉える可能性(1)も。 意思決定や学習の本質的側面の研究にも使われる。 |
転移学習モデル (Transfer Learning Model) | (2) | (1) | 別タスクの学習結果を活用する枠組み。観測データや学習知識を効率良く再利用することが焦点であり、(1) や (3) の性格は弱い。 学習済みモデルの知識の再利用(記述の効率化)。 学習知識を別タスクに活用する代替表現だが、学習転移の本質的メカニズムの研究にも使われる。 |
決定木モデル (Decision Tree Model) | (2) | – | 分類・回帰に用いられる汎用的手法で、観測データをもとに木構造を形成。 分類・回帰のルールを記述。 分類・回帰を行う代替表現として主に機能する。 |
ランダムフォレストモデル (Random Forest Model) | (2) | – | 多数の決定木を組み合わせ、精度を高めるアンサンブル手法。データをよりうまく再現・予測することが目的。 決定木のアンサンブル(記述の精度向上)。 複数決定木をアンサンブルした現実の代替表現として機能する。 |
ブースティングモデル (Boosting Model) | (2) | – | 弱学習器を段階的に補強して精度を高めるアンサンブル手法。やはり観測データの再現・予測重視。 弱学習器の組み合わせ(記述の精度向上)。 弱学習器を逐次的に補強する代替表現として機能する。 |
サポートベクターマシン (SVM) | (2) | (1) | マージン最大化による分類や回帰を行い、観測データを高精度で判別することが主眼。 分類・回帰の境界を記述。 マージン最大化で分類・回帰を行う代替表現だが、分類境界の本質的側面の研究にも使われる。 |
アンサンブルモデル (Ensemble Model) | (2) | – | 複数モデルを組み合わせて予測精度や汎化性能を高める手法(記述の精度・信頼性向上)。 複数モデルを組み合わせた代替表現として機能する。 |
数理モデル (Mathematical Model) | (1) / (2) / (3) のいずれもあり得る | 物理学や化学で本質的構造を簡潔に示すとき(1)、複雑な現象をシミュレーションで再現するとき(2)、純粋数学的に抽象概念を具体化するとき(3) に相当し得る。 現象の数理的本質の表現。 三つの意味すべてに該当する可能性があり、文脈によって変わる。 本質的な物理法則の表現、現象の精密な再現、抽象概念の具体化など多様な役割を持つ。 | |
SEO 関連モデル | |||
情報検索モデル | (2) | 利用者のクエリと文書(データ)との関連度を評価し、必要に応じて文書を検索・提示する目的のモデル。現実の検索タスクやユーザー行動を再現・代替する立場が強く、主として(2) に分類されやすい。 | |
確率的情報検索モデル | (2) | 情報検索モデルのうち、とくに確率分布(関連度の確率など)を導入してクエリと文書の適合度を推定する。観測データ(利用者の反応、文書集合、クエリなど)をもとに実装・評価されるので、(2) が中心。 | |
言語モデル (Language Model) | (2) | 自然言語のテキストデータを学習し、文の生成や単語の出現確率の推定を行うモデル。大量の実世界のテキストデータを再現・予測することに主眼があり、(2) に当たる。近年の大規模言語モデルも含まれる。 | |
統計データ分析 関連モデル | |||
統計モデル (Statistical Model) | (2) | (1) | 観測データを仮定された確率分布で説明し、推定・予測を行う。 データの確率的性質の記述(2)だが、背後にある法則の推定(1)も。 データの背後にある確率分布の代替表現として機能するが、統計的現象の本質的側面を捉える役割も持つ。 |
確率モデル (Probabilistic Model) | (1) | (2) | 確率的仕組みに基づき現象を再現・推定する立場が基本。 統計モデルと同様、確率的な仕組みの本質を表現するが、確率的現象の代替表現としても機能する |
ベイジアンモデル (Bayesian Model) | (1) | (2) | 事前分布とデータから得られる事後分布を推定し、現象を説明・予測する手法。 統計モデルと同様、ベイズ推論の本質を捉えるが、確率的現象の代替表現としても機能する。 |
マルコフモデル (Markov Model) | (1) | (2) | 現象を確率過程として定式化し、現実のデータを再現・推定する目的が強い。 統計モデルと同様、確率過程の本質的性質を捉えるが、時系列現象の代替表現としても使われる。 |
隠れマルコフモデル (Hidden Markov Model) | (1) | (2) | 観測値と隠れた状態の関係を扱い、時系列等の実データを再現・推定する。 マルコフモデルと同様、観測不可能な状態を含む確率過程の本質を捉えるが、具体的現象の代替表現としても使われる |
因子分析モデル (Factor Analysis Model) | (1) | (2) | 多変量データを潜在因子により説明・圧縮しようとするため、観測データの解析・再現が中心。 潜在的な要因の抽出(1)と、それによるデータの記述(2)。 潜在因子による多変量データの本質的構造を捉えるが、データの代替表現としても機能する。 |
潜在クラスモデル (Latent Class Model) | (1) | (2) | サンプルの潜在クラスを推定する手法で、データの分類・再現を目的とする。 潜在クラス構造の本質を捉えるが、分類問題の代替表現としても機能する |
因果推論モデル (Causal Inference Model) | (1) | – | 因果関係を仮定し観測データから介入効果などを推論する。現象理解に迫る要素もあるが、主に実データ分析を通じた推定が焦点。 因果関係という現象の本質の推定。 因果関係の本質を捉えることを主な目的とするモデル。 |
グラフィカルモデル (Graphical Model) | (1) | (3) | 確率変数間の依存構造をグラフで表現し、データから推定・予測する。 確率変数間の関係の記述(2)と、その構造の表現(1)。 確率変数間の依存関係の本質を捉えるが、抽象的な確率概念の具体的表現としても機能する。 |
回帰モデル (Regression Model) | (2) | (1) | データ内の変数関係を捉え、連続値を予測・分析することがメイン。 変数間の関係の記述。 変数間関係の代替表現として機能するが、関係性の本質を捉える側面も持つ。 |
線形回帰モデル (Linear Regression Model) | (2) | (1) | 代表的な回帰手法で、データの傾向分析・予測が中心。 線形関係の記述。 線形関係の代替表現として機能するが、線形性という本質的側面を捉える役割も持つ。 |
部分回帰モデル (Partial Regression Model) | (2) | (1) | 特定の変数の影響を部分的に取り除きながら、現実データを解析。 特定変数間の関係の記述。 特定変数間関係の代替表現だが、因果関係の本質的側面を捉える役割も持つ。 |
ロジスティック回帰モデル (Logistic Regression Model) | (2) | – | 二値分類を確率的に予測し、実際の観測データに適合させるのが目的。 確率的な分類の記述。 確率的二値分類の代替表現として主に機能する。 |
多項ロジスティック回帰モデル (Multinomial Logistic Regression) | (2) | – | 複数カテゴリへの分類を行い、現実のデータを再現・予測する。 多クラス分類の記述。 多値分類の代替表現として主に機能する。 |
正則化回帰モデル (Regularized Regression Model) | (2) | – | 過学習を防ぎつつ現実データへの汎化性能を高める回帰モデル。 過学習を防ぐための回帰(記述の改善)。 過学習を防ぐ代替表現として主に機能する。 |
非線形回帰モデル (Non-linear Regression Model) | (2) | (1) | データに基づき非線形な関係を学習し、予測・分析する(2)。 非線形関係の記述(2)。 非線形関係の代替表現だが(2)、複雑な関係性の本質を捉える側面も持つ(1)。 |
時系列モデル (Time Series Model) | (2) | (1) | 時間列データをもとに予測・分析を行う総称(2)。 時間変化の記述。ただし、モデルによっては背後にある法則の表現(1)も。 |
定常時系列モデル (Stationary Time Series Model) | (2) | 定常仮定を置いて、過去の観測データからの予測・分析(2)。 定常性の仮定の下での記述(2)。 | |
ARモデル (Autoregressive Model) | (2) | 過去の値から現在を予測し、実データを再現・予測するのが目的(2)。 過去の値による予測(記述)(2)。 | |
移動平均モデル (Moving Average Model) | (2) | 過去の誤差を考慮し、データの平滑化や短期予測を行う(2)。 過去の誤差による予測(記述)(2)。 | |
ARMAモデル (自己回帰移動平均モデル Autoregressive Moving Average Model) | (2) | ARモデルとMAモデルを組み合わせ、より現実的な時系列データを再現(2)。 ARモデルとMAモデルの組み合わせ(記述)(2)。 | |
ARIMAモデル (自己回帰和分移動平均モデル Autoregressive Integrated MA Model) | (2) | 非定常な時系列を差分化して取り扱う現実的予測モデル(2)。 非定常データを扱うためのARMAの拡張(記述)(2)。 | |
SARIMAモデル (季節自己回帰和分移動平均モデル Seasonal ARIMA Model) | (2) | 季節性を考慮して、実世界の周期的なデータを再現・予測(2)。 季節性を考慮したARIMAの拡張(記述)。 | |
状態空間モデル (State Space Model) | (2) | (1) | 観測されない内部状態を考慮しつつ、データを再現・予測する(2)。 内部状態と観測データの関係の記述(2)と、その動的システムの表現(1)。 |
VARモデル (Vector Autoregression Model) | (2) | 複数の時系列が相互に影響し合う様をデータから学習(2)。 複数の時系列変数の相互作用の記述。 | |
GARCHモデル (Generalized ARCH Model) | (2) | 分散が時間変化するような金融時系列のボラティリティ予測等に用いられ、実データを再現・分析。 分散の変動の記述。 | |
経営 関連モデル | |||
財務モデル (Financial Model) | (2) | (1) | 企業財務や投資など現実の経済活動をデータをもとに評価・予測する。 財務状況の記述(2)だが、価値評価など本質的な概念を含む場合(1)も。 |
ビジネスモデル (Business Model) | (2)/(3) | 企業・組織の価値創造プロセスを表し、実際の事業を再現・分析する視点が中心。 価値創造の仕組みの「手本」や「典型」としての側面も強い。抽象概念(価値)を具体的な活動に落とし込むため。 | |
離散モデル (Discrete Model) | (1) / (2) / (3) のいずれもあり得る | 離散的な時間・状態を扱う枠組みであり、単純化された理論モデルとして(1)になる場合、複雑系シミュレーションで(2)になる場合、形式的体系を具体化する(3)の場合など、文脈次第で性格が変わる。 離散的な変化の記述(2)だが、その背後にある法則の表現(1)も。 | |
連続モデル (Continuous Model) | (1) / (2) / (3) のいずれもあり得る | 時間や状態を連続的に扱う枠組み。力学系の本質を示す(1)、実際の物理現象をシミュレートする(2)、純粋に抽象的な微分方程式理論を具現化(3)など、多様な利用形態がある。 連続的な変化の記述(2)だが、その背後にある法則の表現(1)も。 | |
構造方程式モデル (SEM) | (2) | (1) | 社会科学・心理学などで観測変数と潜在変数の関係をデータから推定し、理論的仮説を実データで検証する。 潜在変数と観測変数の関係の記述(2)と、その構造の表現(1)。 |
混合効果モデル (Mixed Effects Model) | (2) | 集団内差異(ランダム効果)と固定効果を同時に推定し、実データの偏りや分散構造をより正確に再現(2)。 集団内の差異を考慮した記述。 | |
エージェントベースモデル (Agent-based Model) | (2) | (1) | 個々のエージェントの振る舞いと相互作用から全体の動的パターンをシミュレートし、現実の社会・生態系・経済系などを再現。 エージェントの相互作用の記述(2)だが、創発現象など本質的な現象を捉える可能性(1)も。 |
最適化モデル (Optimization Model) | (2) | (1) | 制約条件下で最適解を探索し、実際のリソース配分や計画立案に適用することが多い。 最適化問題という数理的本質の表現(1)。 |
生態系モデル (Ecosystem Model) | (2) | 生物種や環境要因の相互作用をシミュレートし、生態学的現象を再現・予測(2)。 生物間の相互作用の記述(2)と、その生態系の動態の表現(1)。 | |
気候モデル (Climate Model) | (2) | (1) | 大気・海洋・陸地の相互作用をシミュレートし、地球規模の気候変動を予測・解析する(2)。 気候システムの記述(2)と、その気候変動のメカニズムの表現(1)。 |
水文モデル (Hydrological Model) | (2) | (1) | 降水・流出など水の循環をシミュレートし、実際の流域管理や洪水予測に活用(2)。 水循環の記述(2)と、その流出メカニズムの表現(1)。 |
疫学モデル (Epidemiological Model) | (2) | (1) | 感染症の拡大過程をシミュレートし、感染者数予測や公衆衛生政策に活かす(2)。 感染症の拡大過程の記述(2)と、その感染メカニズムの表現(1)。 |
コンパートメントモデル (Compartment Model) | (2) | (1) | システムを区画に分割して移動や変化を追跡し、感染症や薬物動態学の実データを再現・予測(2)。 区画間の移動の記述(2)と、そのシステムの動態の表現(1)。 |
表は紙面の都合上一部のモデルのみを示していますが、時系列関連モデルやその他の専門モデルも同様の考え方で分類することができます。
多くのモデルは主に第二の意味(代替表現)として機能しながらも、研究文脈によっては第一の意味(本質的理解)や第三の意味(抽象概念の具体化)の側面も持ち合わせていることがわかります。
この「モデル」の定義には、以下の要素が含まれています。
「非線形な世界」大野克嗣 東京大学出版会 を参考に作成。
①対象の存在
モデルは、必ず何か表現する対象を持ちます。それは、現実世界の現象(物理現象、生物現象、社会現象など)、抽象的な概念(価値、知能、言語など)、またはデータそのものであることがあります。
②目的依存性
モデルは、常に特定の目的のために作られます。
その目的は、理解、説明、予測、制御、意思決定支援、論証など、多岐にわたります。同じ対象であっても、目的が異なれば異なるモデルが作られます。
③表現形式
モデルは、さまざまな形式で表現されます。
数式、図、グラフ、プログラム、言葉、物質的な模型など、目的に応じて適切な表現形式が選択されます。
④単純化・抽象化・定式化・具体化
モデルは、対象そのものではなく、その特徴を抽出・変換したものです。
- 単純化 対象の複雑さを減らし、本質的な要素だけを残します。
- 抽象化 対象の具体的な詳細を取り除き、一般的な性質や関係性を抽出します。
- 定式化 対象の要素や関係性を、明確なルールや構造で表現します。
- 具体化 抽象的な概念を、操作可能な形や理解しやすい形で表現します。