基準率 | 用語集 | AlphaInsiders

基準率とは、集団全体で対象の事象がどれくらいの割合で発生しているかを表す確率です。

定義

ある集団における基準率 $P(A)$ は、集団全体の要素数に占める「事象 $A$ が起きている要素数」の割合です。

P(A) = \frac{\text{事象 } A \text{ が起きている集団の要素数}}{\text{集団全体の要素数}}

医療の文脈では有病率（罹患率）がこれに当たり、機械学習では正例の割合がこれに当たります。 $P(A)$ は 0 以上 1 以下の値を取り、その補事象の確率 $P(A^c)$ を足すと $1$ になります。

ベイズの定理では、 $P(A)$ は「観測情報を受け取る前の初期値」として機能します。

P(A \mid B) = \frac{P(B \mid A) \, P(A)}{P(B)}

この式の $P(A)$ が基準率にあたります。 $B$ は観測された事象（例: 検査陽性）、 $P(A \mid B)$ は観測後に更新された確率（陽性的中率）です。基準率を無視・軽視して条件付き確率を直感的に推定してしまう誤りを、Kahneman & Tversky（1973）は「基準率の無視（base rate fallacy / 基準率錯誤）」と名付けました。この認知バイアスは意図的な無視ではなく、確率推論における構造的な直感の癖です。

性質

0 以上 1 以下の値をとる: $P(A)$ は確率なので $0 \le P(A) \le 1$ を満たし、 $P(A) + P(A^c) = 1$ が成り立ちます。
集団の取り方で変わる: 一般成人集団の特定疾患有病率と、専門外来を受診した患者集団の有病率は別の値です。「どの集団を対象にするか」を明示しないと基準率の比較に意味がありません。
事後確率を最も大きく動かす変数の 1 つ: 感度・特異度を固定したまま基準率を 1% から 50% へ変えると、陽性的中率は 9.2% から 91% へ約 10 倍変化します。感度の変動より基準率の変動の方が事後確率への影響が大きいケースがあります。
基準率が小さいほど $P(A \mid B)$ と $P(B \mid A)$ の差が広がる: 感度 $P(B \mid A) = 0.90$ でも、基準率 $P(A) = 0.01$ のとき陽性的中率 $P(A \mid B) \approx 0.092$ です。両者を同一視する誤りが基準率の無視の典型的な表れ方です。

視覚的に見る

感度 $P(B \mid A) = 0.90$ 、偽陽性率 $P(B \mid A^c) = 0.09$ （特異度 91%）を固定したまま、有病率（基準率）だけを 1% と 50% に変えると、陽性的中率がどう変わるかを面積比図（Eikosogram）で対比します。矩形の幅は $P(A)$ （病気帯）と $P(A^c)$ （健康帯）の比、高さの塗り分けは感度と偽陽性率を表します。

有病率 1% のとき（左図）: 病気帯の幅が全体の 1% しかないため、「陽性の横線」を引いたとき、横線より上の面積の大部分は健康×陽性（偽陽性）が占めます。

有病率 50% のとき（右図）: 病気帯と健康帯が等幅になるため、陽性の横線より上の面積の大部分が病気×陽性（真陽性）になります。

左図では赤（病気×陽性）の面積がほぼ見えず、青（健康×陽性）が陽性帯の大部分を占めます。陽性的中率は $0.009 / (0.009 + 0.0891) \approx 9.2\%$ です。右図では赤と青の面積がほぼ等しく、陽性的中率は $0.45 / (0.45 + 0.045) \approx 91\%$ に達します。感度も特異度も同じで、基準率だけが変わると事後確率が約 10 倍変わります。

なぜ感度より基準率が事後確率を大きく動かすのか

感度 90% でスクリーニングしても、有病率 1% の集団に検査を当てると偽陽性の絶対数（健康な 9,900 人のうち 891 人）が真陽性（病気の 100 人のうち 90 人）を大きく上回ります。分子（真陽性）が固定でも分母（全陽性）が膨らめば、陽性的中率は低くなります。

実世界での使われ方

医療検査の陽性的中率

厚生労働省が公表する感染症検査では、感度・特異度が示されても陽性的中率は集団の有病率次第で大きく変わります。有病率が低いスクリーニング集団（例: 無症状者への PCR）では、感度 90%・特異度 99% の検査でも有病率 0.1% なら陽性的中率は約 8% にとどまります。このため、スクリーニング陽性後の精密検査は、偽陽性を除外するための設計上の前提です。有病率が高い有症状者集団（例: 発熱外来）では同じ検査の陽性的中率は大幅に高くなります。同じ検査の同じ感度・特異度でも、対象集団が変われば結論が変わる構造です。

法廷での確率証拠（検察官の誤謬）

「DNA 鑑定で被疑者と証拠の DNA が一致する確率は 100 万分の 1 だ」という証言を、「被疑者が犯人でない確率は 100 万分の 1」と読み替えることを「検察官の誤謬（prosecutor's fallacy）」と呼びます。基準率（容疑者の規模、すなわち犯人候補が何人いるか）を無視した誤りで、英国の R v Adams（1996）事件ではこの誤謬が有罪判決の基礎になり、控訴裁判所がベイズの定理の法廷利用について判断を下しました。母集団が大きければ「一致確率 100 万分の 1」でも候補者が複数いることは十分あり得ます。事後確率 $P(\text{無罪} \mid \text{証拠一致})$ を計算するには基準率（犯人候補集団の規模）が必要で、それなしに $P(\text{証拠一致} \mid \text{無罪})$ の小ささを有罪の根拠にするのは論理的に誤りです。

機械学習でのクラス不均衡

詐欺検知・異常検出など、正例の基準率が 0.1% 以下になるタスクでは「全部負例と予測する」だけで正確度（accuracy）が 99.9% になります。基準率が低い問題では accuracy は評価指標として機能せず、precision・recall・AUC-ROC のような基準率に依存しない指標で評価する必要があります。基準率の変動に対してモデルの性能評価がどう変わるかを把握するには、precision-recall 曲線が accuracy より直接的な情報を与えます。

深掘り

Kahneman & Tversky のタクシー問題

Kahneman, D., & Tversky, A.（1973, Psychological Review, 80(4), 237–251）が用いた実験問題の一つです。「ある町でひき逃げ事故が起きた。目撃者は加害車が緑のタクシーだったと証言した。この町のタクシーは青が 85%・緑が 15%。目撃者は夜間照明下で色を 80% の精度で識別できる。本当に加害車が緑だった確率は？」

直感的な答えは 80% です。しかしベイズの定理で計算すると、

P(\text{緑} \mid \text{緑と証言}) = \frac{0.80 \times 0.15}{0.80 \times 0.15 + 0.20 \times 0.85} = \frac{0.12}{0.12 + 0.17} \approx 0.41

約 41% になります。識別精度 80% という「観測情報」を基準率（緑タクシーは 15%）と組み合わせると、事後確率は識別精度を大きく下回ります。Kahneman らはこの実験から、人間が確率推論で系統的に基準率を軽視することを示しました。

検察官の誤謬の数学的構造

条件付き確率の非対称性がこの誤謬の核心です。

P(\text{無罪} \mid \text{証拠一致}) \ne P(\text{証拠一致} \mid \text{無罪})

後者は「無実の人が証拠と偶然一致する確率」で、これが 100 万分の 1 だとしても、前者（実際に無罪である確率）は集団中の犯人候補の数（基準率の逆数に対応）に依存します。人口 1,000 万人の都市で犯人が 1 人の場合、無実の人で一致が起きる期待数は $9{,}999{,}999 / 1{,}000{,}000 \approx 10$ 人です。証拠が一致した候補が 11 人いる状況で特定の 1 人を「犯人」と断定する根拠は、DNA 一致確率だけでは不十分です。

よくある誤解

「DNA 証拠は 100 万分の 1 の精度なので信頼性が高い」は正しい。「したがって被疑者が犯人だ」は論理的に別の主張で、基準率（他に候補者がいるか）を無視しています。感度の高さは事後確率の高さではありません。

自然頻度形式の効果

Gigerenzer, G., & Hoffrage, U.（1995, Psychological Review, 102(4), 684–704）は、確率表現と自然頻度表現で医師・学生の推論正答率がどう変わるかを実験しました。「有病率 1%、感度 90%、偽陽性率 9%」と確率で提示すると正答率は低く、「1,000 人中 10 人が罹患、そのうち 9 人が陽性、残り 990 人のうち 89 人も陽性になる」と頻度で提示すると正答率が大きく改善しました。Eddy（1982, Kahneman & Tversky 編 "Judgment under uncertainty" 所収）では同種の問題に正答した医師はわずか 5% でした。これらの結果は、基準率の無視が能力の問題ではなく情報提示形式の問題であることを示します。確率の数字より「何人中何人」という頻度形式の方が、分母（全陽性数）と分子（真陽性数）の比率を直感的に把握しやすいと解釈されています。

この用語を扱う本編記事

stats-07: 条件付き確率とベイズの面積（節 5 で乳がん検査の陽性的中率 9.2% を題材に、基準率が事後確率を決定づける構造を式から展開します）

よくある誤解

「感度が高い検査で陽性なら、高い確率で病気だ」という直感は、有病率（基準率）が無視されています。感度 90% は「病気の人が陽性になる確率」であって「陽性の人が病気である確率」ではありません。Eddy（1982）の報告では同種の問題に正答した医師は約 5% で、基準率の無視は医学的訓練を経ても修正されにくい構造的なバイアスです。

「基準率の無視」という日本語は「意図的に無視した」と受け取られがちですが、Kahneman らの原語 "neglect" は「軽視・見落とし」のニュアンスです。日本語では「基準率錯誤」の表記もあり、両者は同じ現象を指します。意図的な操作ではなく、確率推論時の系統的な認知バイアスです。

定義

性質

視覚的に見る

実世界での使われ方

医療検査の陽性的中率

法廷での確率証拠（検察官の誤謬）

機械学習でのクラス不均衡

深掘り

Kahneman & Tversky のタクシー問題

検察官の誤謬の数学的構造

自然頻度形式の効果

関連する用語

この用語を扱う本編記事

よくある誤解