当サイトを閲覧いただきありがとうございます。 本記事は「ベイズ推定」について解説します。
新しい情報を得るたびに、確率の見積もりを更新していくという思考法です。18世紀の牧師トーマス・ベイズの遺稿に由来し、現代の機械学習・医学診断・スパムフィルタ・科学的推論に広く使われています。
ベイズとその定理の歴史
ベイズの定理の名の由来はトーマス・ベイズ(1702〜1761年)です。イギリスの非国教会の牧師でありながら数学と哲学に強い関心を持ち、「確率とは何か」という問いに取り組みました。
ベイズは生前に論文を発表しませんでしたが、1763年に友人のリチャード・プライスが遺稿から論文を発見し、ロンドン王立協会の紀要に発表しました。これが「確率の逆問題に関する論文」です。
しかし当時この論文はほとんど注目されませんでした。ほぼ同時期にピエール=シモン・ラプラスが独立に同様の定理を導いており、フランスでは長く「ラプラスの定理」と呼ばれていました。ベイズの名前が広く知られるようになったのは20世紀後半、特にコンピュータの普及によってベイズ計算が実用的になってからです。
ベイズの定理の導出
ベイズの定理は条件付き確率の基本的な性質から導出できます。
事象AとBの同時確率P(A,B)は次の2通りで表せます。
P(A,B) = P(A|B) × P(B)(BのもとでAが起きる確率 × Bが起きる確率)
P(A,B) = P(B|A) × P(A)(AのもとでBが起きる確率 × Aが起きる確率)
右辺同士を等号で結んでP(A|B)について解くと:
P(A|B) = P(B|A) × P(A) / P(B)
これがベイズの定理です。
推定の文脈に当てはめると:
- P(A):事前確率(Prior)── 証拠を見る前の仮説Aへの信念の度合い
- P(B|A):尤度(Likelihood)── 仮説Aが正しい場合に証拠Bが得られる確率
- P(B):周辺確率 ── 証拠Bが得られる確率(全仮説にわたる加重平均)
- P(A|B):事後確率(Posterior)── 証拠Bを見た後の仮説Aへの信念の度合い
これをわかりやすく表現すると「事後確率 ∝ 事前確率 × 尤度」(∝は比例の意)になります。
医療診断の具体例
ベイズの定理が直感に反する推論を生む典型例が医療診断です。詳しく計算します。
前提条件:
- ある疾患の有病率(集団中の罹患割合):1%
- 検査の感度(実際に病気の人が陽性になる確率):95%
- 検査の特異度(実際に健康な人が陰性になる確率):95%
検査で陽性が出た場合、実際に病気である確率(陽性的中率)は何%でしょうか。
多くの人は「検査精度が95%だから90〜95%程度」と答えます。正解を計算します。
1万人を検査する場合:
- 病気の人:100人(有病率1%)
- 陽性(真陽性):100 × 0.95 = 95人
- 陰性(偽陰性):5人
- 健康な人:9,900人
- 陰性(真陰性):9,900 × 0.95 = 9,405人
- 陽性(偽陽性):9,900 × 0.05 = 495人
陽性反応が出る人の合計:95 + 495 = 590人 そのうち本当に病気:95人
陽性的中率 = 95 / 590 ≈ 16%
精度95%の検査で陽性が出ても、実際に病気の可能性は約16%しかないという結果です。
なぜこうなるのか。疾患の有病率(事前確率)が低い(1%)ため、母数のほとんどが健康な人です。感度95%でも5%の偽陽性率で9,900人の健康な人から495人の偽陽性が生じます。これが少ない真陽性(95人)を大幅に超えます。
この例から分かる教訓:事前確率(有病率・基礎率)が低い状況では、精度の高い検査でも陽性の大半は偽陽性になる。
この原則は「基礎率の無視(Base Rate Neglect)」という認知バイアスの問題と直結します。人間は事前確率を無視して検査結果や証拠だけに注目しがちです。
複数の証拠によるベイズ更新
ベイズ推定の強力な性質は、証拠を積み重ねるたびに「事後確率が次の事前確率になる」という逐次更新にあります。
例として、工場の機械が故障しているかどうかを診断する場合を考えます。
初期状態:事前確率として「故障している確率10%」を持つとします。
第1の証拠:異音が検出された。正常な機械で異音が出る確率は5%、故障機械で異音が出る確率は80%とします。
ベイズ更新:
- 事後確率 ∝ 0.10 × 0.80(故障×異音の尤度)= 0.080
- ∝ 0.90 × 0.05(正常×異音の尤度)= 0.045
- 合計:0.125
- 正規化後の故障確率:0.080 / 0.125 ≈ 64%
異音という証拠で故障確率が10%から64%に跳ね上がりました。
第2の証拠:振動が正常範囲内と計測された。正常機械での正常振動の確率90%、故障機械での正常振動の確率30%とします。
ベイズ更新(事前確率は64%に更新済み):
- ∝ 0.64 × 0.30(故障×正常振動の尤度)= 0.192
- ∝ 0.36 × 0.90(正常×正常振動の尤度)= 0.324
- 合計:0.516
- 正規化後の故障確率:0.192 / 0.516 ≈ 37%
振動が正常という証拠で故障確率が64%から37%に下がりました。
このように新しい証拠が来るたびに確率を更新し、最終的に精度の高い判断に近づくのがベイズ推定の学習プロセスです。
頻度主義とベイズ主義の違い
統計学には2つの主要な学派があります。
頻度主義(Frequentism):確率を「同一条件での試行を無限回繰り返したときの頻度の極限」として定義します。
- 「このコインの表が出る確率は0.5」という主張は、同じコインを無限に投げたときの比率で定義されます
- パラメータ(母集団の平均など)は固定の真値であり、データが確率変数です
- 主な推論手法:仮説検定(p値)・信頼区間
ベイズ主義(Bayesianism):確率を「ある命題が真である信念の度合い(Degree of Belief)」として定義します。
- パラメータ自体が確率分布を持つと見なします
- 事前分布(Prior)を設定し、データを見て事後分布(Posterior)に更新します
- 主な推論手法:ベイズファクター・信用区間(クレディブル区間)
両学派の主な違い:
| 項目 | 頻度主義 | ベイズ主義 |
|---|---|---|
| 確率の定義 | 長期頻度 | 信念の度合い |
| パラメータ | 固定の真値 | 確率分布を持つ |
| 事前情報 | 使わない | 事前分布として明示的に組み込む |
| 解釈 | 信頼区間(長期的に95%含む) | 信用区間(事後確率95%) |
| 「一度きりの事象」の確率 | 定義できない | 定義できる |
「明日雨が降る確率は40%」という気象予報の確率はベイズ的です。「明日の天気」は一度しか起きない事象なので頻度主義では確率を定義しにくく、「与えられた大気データのもとで雨が降る信念の度合い」という解釈になります。
スパムフィルタとナイーブベイズ
メールのスパムフィルタはベイズ推定の最も普及した実用例の一つです。
「ナイーブベイズ分類器(Naive Bayes Classifier)」と呼ばれる手法は次のように動作します。
各単語について「この単語がスパムメールに出現する確率」と「正当なメールに出現する確率」を事前に学習しておきます。
新しいメールが届いたとき、メール内の全単語の出現を独立な証拠として扱い(これが「ナイーブ」=独立仮定の意味)、ベイズ更新を繰り返して「このメールがスパムである確率」を計算します。
- 「無料」「今すぐ」「当選」「クリック」などはスパムに多く出現 → スパム確率を上げる
- 「会議」「報告書」「よろしくお願いします」などは正当メールに多く出現 → スパム確率を下げる
ナイーブベイズは計算が単純で実装が容易なため、テキスト分類・感情分析・医療診断など多くの機械学習タスクで今でも使われる基本アルゴリズムです。
ベイズ的な思考の認知バイアスへの応用
ベイズ推定は、人間がしばしば犯す認知バイアスを特定するフレームワークとして使えます。
基礎率の無視(Base Rate Neglect):事前確率(基礎率)を無視して、目の前の証拠だけで判断する傾向です。医療診断の例で示したように、有病率を考慮しないと陽性の意味を大幅に誤解します。
確証バイアス(Confirmation Bias):自分の信念を支持する証拠は積極的に集め(尤度を高く評価し)、反証する証拠は無視または軽視する傾向です。ベイズ的には、自分の仮説を否定する証拠も正直に尤度に反映させる必要があります。
係留バイアス(Anchoring):最初に提示された情報が事前確率のように固定されてしまい、それ以降の証拠によっても十分に更新されない傾向です。
後知恵バイアス(Hindsight Bias):事後に「最初からそうなると分かっていた」と思う傾向。事前に持っていた確率分布が、結果が判明した後に遡及的に「それが正しかった」として記憶の中で書き換えられます。
これらのバイアスは、ベイズ更新を正しく行っていない(事前確率を無視・尤度を歪める・更新が不十分)結果として説明できます。
ベイズ的意思決定の実践
ベイズ推定を意思決定に活用する際の実践的な手順を示します。
ステップ1:事前確率を設定する 「この仮説(候補・原因・リスク)がどのくらい起こりうるか」を明示的に数値化します。過去データ・業界統計・専門家の知見が活用できます。
ステップ2:尤度を評価する 「この仮説が正しい場合、観察された証拠はどのくらい起こりやすいか」を評価します。検査の感度・予測モデルの精度・専門家証言の信頼性などが尤度に相当します。
ステップ3:事後確率を計算(または概算)する 事前確率 × 尤度の相対的な大きさで事後確率を見積もります。厳密な計算でなくても、「A仮説の事前 × 尤度」と「B仮説の事前 × 尤度」の比較で相対的な判断が可能です。
ステップ4:追加証拠を収集して更新する 一度計算した事後確率を固定せず、新しい証拠が来るたびに更新します。「一度決めたら変えない」はベイズ的ではなく、「証拠を見て少しずつ更新する」が合理的な態度です。
ステップ5:意思決定基準を持つ 「どのくらいの確率になったら行動するか」の閾値を意識します。医療なら「陽性確率50%以上で精密検査」、投資なら「期待リターンがコストを超える確率60%以上で実行」など。
まとめ
本記事は「ベイズ推定」について解説しました。如何だったでしょうか。
ベイズ推定は統計手法の一つではなく、「新しい証拠が来たらそれを反映して考えを更新する」という合理的な認識論の枠組みです。事前確率を明示的に持ち、証拠を見るたびに更新し、最終的な信念を事後確率として表現するというプロセスは、科学・医療・意思決定のあらゆる場面で有効です。
頻度主義の仮説検定が「データはあり得るか」を問うのに対し、ベイズ推定は「仮説はどのくらい信じられるか」を直接問います。この問い方の違いが、実践的な意思決定に対するベイズ推定の使いやすさの源です。
また、ベイズ推定は情報の非対称性が存在する状況(相手のタイプが不明な交渉・保険・オークション)での合理的な信念更新の基盤でもあります。
フレームワーク一覧・ゲーム理論概論は以下からどうぞ。
それでは次の記事も閲覧いただけると幸いです。