エンティティとは
エンティティとは、人・場所・組織・作品・製品・抽象概念などの現実世界のもの(thing)を、一意ID・型(type)・属性・関係で表したナレッジグラフのノードです。
Googleは「Things, not strings」と表現しており、文字列一致から概念理解への転換点になりました。
GoogleはWeb上の構造化マークアップ(schema.org)、Wikipedia/Wikidata/Freebase起源の知識、オープンIE等から事実(トリプル)を収集・統合し、確率的に信頼度を推定してナレッジグラフへ編入します(Knowledge Vault, KBT)。
検索では、クエリ中のエンティティを検出・曖昧性解消して正規IDに紐づけ、関連エンティティや属性を使ってクエリ解釈・拡張・ランキング・ナレッジパネル表示を行います。
AIモード(AI Overviews)のような生成系では、検索インデックス/ナレッジグラフでのグラウンディングによりLLM出力を事実に接続します。Google公式もGroundingを明言(Vertex AI/Gemini API)しており、検索の文脈でも同様の設計思想が使われます。
検索・AIにおける「エンティティ」
形式
(ID, Type, Attributes, Relations, Aliases, Provenance, Temporal Qualifiers)
(例)( /m/0dl567, Person, {birthDate=..., worksFor=...}, {spouseOf=..., educatedAt=...}, 別名, 出典, 時制 )
思想
「文字列(strings)ではなく事物(things)」として扱う。これにより同形異義語(ジャガー=動物/車/OS)を一意IDで切り分け、言語をまたいだ統合も容易にする。
エンティティはどう作られるか
エンティティのデータ源と構築
(a) 構造化データの取り込み
schema.orgにより、Webページ側がPerson/Organization/Event
等の型付き属性を明示。検索エンジンはこれを取り込み、同定・属性付与を行う。
(b) 既存KBの統合とID整備
GoogleはFreebaseを核にナレッジグラフを構築し、のちにWikidataへマイグレーション対応(Freebase MID ⇔ Wikidata)のマッピング研究が公表されています。Wikidata側にもFreebase ID (P646)やGoogle KG ID (P2671)がある。
(c) 非構造テキストからの事実抽出(Open IE)
TextRunner/ReVerb/Ollie/ClausIEなどのOpen IE系手法で文章から(主語, 述語, 目的語)のトリプルを大量抽出。GoogleのKnowledge Vault (KDD’14)は抽出事実を確率的知識融合で統合し校正済み確率を付与。KBT (VLDB’15)はWebソース自体の信頼度推定を提案。
(d) エンティティ検出・曖昧性解消(EL/NED)
文書やクエリ内の表層語を候補エンティティ集合に引き、文脈・共起・一貫性でスコアリングして正規IDへリンク。古典的なAIDA(集合理解)から、BERT系のBLINK/ELQまで実用レベルの精度が向上。特許でもエンティティ認識を索引メタデータに付与する記載。
ナレッジグラフとしてのエンティティの表現と推論
(a) グラフ表現・重み付け
ノード(エンティティ)とエッジ(関係)からなるトリプル格納に加え、時間性・出典・確信度などのメタを持つ。Google関連の解説や分析では信頼性・人気・時間・近接等の重みが参照されます(特許・周辺文献の整理)。
(b) 埋め込み学習(KGE)
TransE/TransH/TransR/RotatEなどのナレッジグラフ埋め込みにより、欠落リンク予測や類推が可能。Googleの特許群や近年のサーベイでもKGEでのスコアリングや信頼度推定が標準的技法として扱われます。
検索パイプラインにおけるエンティティの役割
(1) クエリ理解
クエリをトークン分割→エンティティ候補生成→曖昧性解消→正規ID化。関連エンティティや属性語を用いたクエリ拡張(同義語・上位下位概念)や意図判定に活用。Named-entity disambiguationの特許はWikipediaのリダイレクト/カテゴリ/リンク等を素性にスコアリングする枠組みを示す。
(2) インデックス付け
文書側にもエンティティ注釈を付与し、ドキュメント×エンティティの倒立+前処理を保持。Google特許には「ページに一意エンティティIDをタグ付けし索引メタデータに格納」と明記。
(3) ランキング
エンティティ指標(クエリ型やエンティティ種別に応じて重みを変える指標)でランキングスコアを組み立てる手法が特許化。関連性・人気・信頼性等の複数指標を線形/学習的に統合。
(4) ナレッジパネル/直接回答
エンティティの概要・属性・公式サイト・画像等を統合してナレッジパネルを組み立てる特許と公式解説がある(要約文の候補抽出・UI要件を記載)。
エンティティとAIモード/AIによる概要
グラウンディング
生成系ではLLMが出力を作るが、その事実基盤として検索インデックスや外部KB(ナレッジグラフ)にグラウンディングするのが現在の主流設計。GoogleはVertex AI/Gemini APIのドキュメントで検索/データソースによるGroundingを公式に説明。AI による概要自体の紹介でも、検索での生成要約の考え方が示される。
GoogleはData CommonsナレッジグラフによるLLMの事実性向上も紹介しており、これはエンティティ(地域/統計指標など)をキーに数値・系列へ厳密に接続する例です。
エンティティの生成・統合
(1)候補生成(Aliasテーブル、リダイレクト、同義語、Wikipedia/Wikidata/Freebaseのリンク構造・カテゴリ等)
(2)局所文脈によるスコアリング(周辺語・依存関係・言語モデル)
(3)集合的一貫性(テキスト中に出現する複数エンティティの相互整合性を最大化:AIDA系列)
(4)人気度・事前確率(リンク頻度・出現頻度・話題性等)
(5)確率的知識融合(抽出器ごとの誤り特性を踏まえ、事実確率を校正:Knowledge Vault)
(6)ソース信頼度推定(KBT:リンク等の外生指標ではなく事実の正しさに基づく信頼度)
(7)KGEによる補完(リンク予測で未知関係を提案・補完・信頼度スコア付与)
(8)検索への落とし込み(クエリ拡張・ランキング・ナレッジパネル)
これらは、NED/EL(AIDA/BLINK/ELQ)、Open IE、Knowledge Vault/KBT、KGE(TransE/RotatE等)、エンティティ指標に基づくランキング特許で裏づけられる流れです。
エンティティの数学的な見取り図
(1)エンティティ同定
$$e^*=\arg\max_{e\in C(m)} \big\{\lambda_1\,\text{LM}(\text{ctx}(m),e)+ \lambda_2\,\text{prior}(e)+ \lambda_3\,\text{coh}(E_{-m}\cup\{e\})\big\}$$
\(C\)
表層語 \(m\)の候補エンティティ集合
\(\text{LM}\)
言語モデル由来の文脈適合(BI-encoder/Cross-encoder、BERT/BLINK等)
\(\text{prior}\)
人気度・リンク確率・出現頻度
\(\text{coh}\)
集合的一貫性(AIDA系)
(概念的定式化。実装は学習到達度に応じて別設計)
(2)知識融合(Knowledge Vault)
抽出器 iii の観測 oio_ioi を生成モデルで統合し、事実 ttt の尤度/事後を校正。
$$ P(t \mid \{o_i\}) \propto P(t)\prod_{i} P(o_i \mid t, \theta_i)$$
ここで \(\theta_i\) は抽出器の誤り特性。KBTでは事実の正否から逆算してソース信頼度を推定。
(3)KGE
TransE
$$\mathbf{h}+\mathbf{r}\approx\mathbf{t}$$
を満たすように埋め込みを学習、スコア
$$
f(h,r,t) = -\| \mathbf{h} + \mathbf{r} – \mathbf{t} \|
$$
RotatE
複素空間で \(\mathbf{t}\approx\mathbf{h}\circ \mathbf{r}\)(回転)とし、対称/反対称・逆関係・合成など多様な関係パターンを表現。
エンティティはどこで見える化されるか
検索結果の右側のナレッジパネルは、対象がエンティティであると判定されたときに、概要・属性・リンク等を提示するUI。関連特許・公式ガイドが公開されています。
クエリの自動解釈(例:「トヨタ 売上 2023」→Organization=トヨタ
+Metric=売上
+Time=2023
)や、関連エンティティの提示、意図別の垂直検索(地図/画像/ニュース)などにも波及。ランキングではエンティティ指標を組み込む設計が特許化。
AIモード(AI による概要)は、複数ページの要点を生成要約しつつ、根拠ページと事実にグラウンディングすることで、LLMの幻覚を抑制する方向へ進化。
エンティティに関する研究課題
(1)時間的・地理的整合性
属性値の時制(役職・売上・人口等)をどう管理するか。
(2)由来・出典の説明可能性
Provenanceをどこまで公開・可視化するか(説明責任)。
(3)生成系の安全性
Grounding/検証と生成のループをどう安定化させるか。
(4)スケールと新規性
新規エンティティの発見・同定(open-world EL)、継続的学習。
(5)多言語・多モーダル
MUM等によるクロスリンガル/モーダルなエンティティ統合。
文字列はただの綴り、エンティティは現実の対象。検索は後者をIDで扱うことで、曖昧さと言語差を超えて意味で結びます。これがランキング・ナレッジパネル・AIモードの根拠提示を可能にしています。