本文へスキップ
用語解説確率

二項分布

成功確率 p のベルヌーイ試行を独立に n 回繰り返したときの成功回数が従う離散確率分布。XB(n,p)X \sim B(n, p)P(X=k)=(nk)pk(1p)nkP(X=k)=\binom{n}{k}p^k(1-p)^{n-k}E[X]=npE[X]=npVar[X]=np(1p)\mathrm{Var}[X]=np(1-p)。コイン投げの表の回数・A/B テストのコンバージョン数・品質検査の不良品数の基本分布。

定義

二項分布(B(n,p)B(n, p))とは、成功確率 ppベルヌーイ試行独立nn 回繰り返したときの成功回数が従う離散確率分布です。期待値npnp、分散は np(1p)np(1-p) で、コイン投げの表の回数・A/B テストのコンバージョン回数・品質検査の不良品数を表す基本分布として広く使われます。

成功確率 pp の試行を 1 回だけ行うことをベルヌーイ試行(bernoulli trial)といいます。コインを 1 回投げて表が出れば成功(確率 p=0.5p=0.5)、裏が出れば失敗(確率 1p=0.51-p=0.5)という単純な試行です。このベルヌーイ試行独立nn 回繰り返したとき、成功の総回数を XX で表します。XX が従う分布を 二項分布 B(n,p)B(n, p) と書き、XB(n,p)X \sim B(n, p) と表記します。

確率質量関数(PMF: probability mass function)は次の式で与えられます。XX がちょうど kk 回成功する確率 P(X=k)P(X = k) を、k=0,1,,nk = 0, 1, \ldots, n に対して計算する式です。

P(X=k)=(nk)pk(1p)nkP(X = k) = \binom{n}{k} p^k (1-p)^{n-k}

記号の意味を整理します。nn は試行回数(正の整数)、pp は 1 回の試行で成功する確率(0p10 \le p \le 1)、kkXX の具体的な値(0,1,,n0, 1, \ldots, n のいずれか)、そして pkp^kkk 回連続で成功する確率、(1p)nk(1-p)^{n-k} は残り nkn-k 回が失敗する確率です。

(nk)\binom{n}{k}(読み方: nn コンビネーション kk、または nnkk の組み合わせ)は「nn 個の試行のうち kk 個が成功する並び順の総数」です。nn 回の試行から成功した kk 回を選ぶ方法が (nk)=n!k!(nk)!\binom{n}{k} = \frac{n!}{k!(n-k)!} 通りあり、どの並び順も確率 pk(1p)nkp^k(1-p)^{n-k} で起きます。それを足し合わせた結果が P(X=k)P(X=k) です。コインを 3 回投げて表が 2 回出る事象を例にとると、「表表裏・表裏表・裏表表」の 3 通りが該当し、(32)=3\binom{3}{2} = 3 がその個数に対応します。

性質

  • 試行の独立性が前提: nn 回の試行が互いに独立でなければ Var[X]=np(1p)\mathrm{Var}[X] = np(1-p) は成り立ちません。試行間に正の相関があると分散は np(1p)np(1-p) より膨らみ、負の相関なら縮みます。期待値 E[X]=npE[X]=np独立性なしに成り立ちます期待値の線形性だけで導けるため)。期待値と分散で独立性の要否が異なる点は深掘りセクションで詳しく扱います。

  • 期待値 E[X]=npE[X]=np線形性で 2 行: 成功回数を X=X1+X2++XnX = X_1 + X_2 + \cdots + X_n(各 XiX_i は 0 か 1 のベルヌーイ変数)と分解すると、E[Xi]=pE[X_i] = p です。期待値の線形性から E[X]=i=1nE[Xi]=npE[X] = \sum_{i=1}^{n} E[X_i] = np が得られます。独立性は不要です。

  • 分散 Var[X]=np(1p)\mathrm{Var}[X]=np(1-p) には独立性が必要: 各 XiX_i の分散は Var[Xi]=p(1p)\mathrm{Var}[X_i] = p(1-p) で(ベルヌーイ変数は 0 か 1 なので Xi2=XiX_i^2 = X_i、よって E[Xi2](E[Xi])2=pp2=p(1p)E[X_i^2] - (E[X_i])^2 = p - p^2 = p(1-p))、独立確率変数の和の分散は分散の和になる性質から Var[X]=np(1p)\mathrm{Var}[X] = np(1-p) となります。

  • p=0.5p=0.5 で左右対称、pp が 0 や 1 に近いと偏る: p=0.5p=0.5 のとき PMF は k=n/2k=n/2 を中心に左右対称な釣鐘型になります。p=0.1p=0.1 なら低い kk 側に質量が集中した右裾の長い形になり、p=0.9p=0.9 なら高い kk 側に集まった左裾の長い形になります。

視覚的に見る

B(100,0.5)B(100, 0.5) の確率質量関数を縦棒グラフで示します。横軸が成功回数 kk、縦軸が確率 P(X=k)=(100k)(0.5)100P(X=k) = \binom{100}{k}(0.5)^{100} です。赤の縦線が μ=np=50\mu = np = 50期待値)、青の破線 2 本が μσ=45\mu - \sigma = 45μ+σ=55\mu + \sigma = 55σ=np(1p)=25=5\sigma = \sqrt{np(1-p)} = \sqrt{25} = 5)です。

B(100, 0.5) の確率質量関数: コインを 100 回投げたときの表の回数の分布μ = np = 50μ - σ = 45μ + σ = 5535404550556065成功回数 k0.000.020.040.060.08P(X = k)

各縦棒の高さは「コインを 100 回投げたとき、表がちょうど kk 回出る確率」です。k=50k=50 で約 7.96% が最大で、そこから左右に離れるほど確率は急速に小さくなっていきます。k=40k=40k=60k=60 ではすでに 1.08% 程度まで下がっています。

青の破線で囲まれた k=45k=45 から k=55k=55 の範囲、つまり「平均 ± 1 標準偏差」の帯に全確率の約 73%(正確には 72.87%)が収まっています。正規分布の経験則(± 1σ1\sigma に約 68%)に近い数字が、nn が大きい二項分布でも自然に現れます。これは偶然ではなく、後述する正規近似の理論的な背景があります。

pp を 0.5 から外すと、図の形は非対称になります。p=0.3p=0.3 なら棒の山は k=30k=30 近傍に移動し、右裾が長くなります。p=0.7p=0.7 ならその鏡像です。μ=np\mu = nppp に比例して左右に動き、σ=np(1p)\sigma = \sqrt{np(1-p)}p=0.5p=0.5 のとき最大になり、pp が 0 や 1 に近づくと縮んでいきます。

実世界での使われ方

A/B テストのコンバージョン数: ウェブサービスで「新デザインで 1,000 人中何人がボタンをクリックしたか」は、クリック率 ppベルヌーイ試行 n=1,000n=1{,}000 回として B(1000,p)B(1000, p) で扱えます。統計的有意性の検定(フィッシャーの正確検定や χ2\chi^2 検定)は内部でこの二項分布を使います。Kohavi らの実験設計の教科書(Trustworthy Online Controlled Experiments, Cambridge UP 2020)の第 4 章では、二項分布を前提とした検出力計算と標本サイズ決定が詳細に解説されています。

品質管理(QC)の不良品検査: 製造ラインからサンプリングした nn 個の製品のうち不良品が何個か、という問いです。不良率 pp の母集団からの独立サンプリング下で不良品数は B(n,p)B(n, p) に従い、JIS の npnp 管理図・pp 管理図の理論的基礎になっています(JIS Z 9020-2:2016 シューハート管理図 参照)。μ=np\mu = np が管理中心線、μ±3σ=np±3np(1p)\mu \pm 3\sigma = np \pm 3\sqrt{np(1-p)} が管理限界線です。

ワクチン有効率の信頼区間: 治験でワクチン群 NN 人中 XX 人が感染した場合、感染者数は B(N,pvaccine)B(N, p_{\text{vaccine}}) に従います。Polack ら(NEJM 2020)のファイザー mRNA ワクチン治験は、この二項分布ベースの信頼区間で 95.0%(95% CI: 90.3〜97.6%)のワクチン有効率を報告しました。

遺伝学のメンデル比: 雑種第二代の個体 nn 個体における優性表現型の個数は、優性発現確率 p=3/4p = 3/4ベルヌーイ試行の和として B(n,3/4)B(n, 3/4) に従います。メンデルの実験では期待値 np=3n/4np = 3n/4 の「3 対 1 比」が確認されました。

深掘り

分散の導出は計算に慣れた読者向けです。結果 np(1p)np(1-p) だけ覚えれば実用上は足ります。

分散 np(1p)np(1-p) の導出

X=X1+X2++XnX = X_1 + X_2 + \cdots + X_n(各 XiX_i独立ベルヌーイ変数)と分解します。ベルヌーイ変数は 0 か 1 しか取らないので Xi2=XiX_i^2 = X_i が成り立ちます。よって

Var[Xi]=E[Xi2](E[Xi])2=E[Xi](E[Xi])2=pp2=p(1p)\mathrm{Var}[X_i] = E[X_i^2] - (E[X_i])^2 = E[X_i] - (E[X_i])^2 = p - p^2 = p(1-p)

となります。

ここで「独立確率変数の和の分散は、各変数の分散の和に等しい」という性質(stats-08 で詳しく扱います)を使います。独立性があるとき Var[X1++Xn]=Var[X1]++Var[Xn]\mathrm{Var}[X_1 + \cdots + X_n] = \mathrm{Var}[X_1] + \cdots + \mathrm{Var}[X_n] が成り立つので

Var[X]=i=1nVar[Xi]=np(1p)\mathrm{Var}[X] = \sum_{i=1}^{n} \mathrm{Var}[X_i] = n \cdot p(1-p)

が得られます。

ここで「独立性」が効いています。期待値の線形性 E[X1++Xn]=E[X1]++E[Xn]E[X_1 + \cdots + X_n] = E[X_1] + \cdots + E[X_n]独立性なしに成り立ちますが、分散の加法性 Var[Xi]=Var[Xi]\mathrm{Var}[\sum X_i] = \sum \mathrm{Var}[X_i]独立性(より正確には無相関性)を必要とします。試行間に正の相関が混入すると、この等式の右辺に共分散の正の項が加わり、分散は np(1p)np(1-p) より大きくなります。二項分布の定義に「独立な繰り返し」が組み込まれているのはそのためです。

独立性が崩れると分散が膨らむ

アンケートで「同じ世帯から複数人を抽出する」設計では、同世帯の回答者間に相関が生じます。このとき不良品数や陽性者数を B(n,p)B(n, p) で扱うと、実際の分散を過小評価します。これを過分散(overdispersion)と呼びます。

正規近似と中心極限定理

nn が大きく pp が極端でない(経験則として np5np \ge 5 かつ n(1p)5n(1-p) \ge 5)とき、B(n,p)B(n, p) は正規分布で近似できます。

B(n,p)N(np, np(1p))B(n, p) \approx N(np,\ np(1-p))

これは中心極限定理(CLT)の最も古典的な応用です。X=X1++XnX = X_1 + \cdots + X_n独立同分布の確率変数の和であり、CLT は「和が正規分布に近づく」ことを保証します。この結果は de Moivre が 1733 年に p=1/2p=1/2 の場合に発見し、Laplace が 1812 年に一般の pp へ拡張しました(de Moivre-Laplace の定理)。

上の図で B(100,0.5)B(100, 0.5) が釣鐘型に見えるのはこの近似が働いているからです。正規分布の経験則「±1σ\pm 1\sigma に約 68%」が二項分布でも成り立つ(実際は約 73%、正確には 72.87%)のも、正規近似の精度の高さを反映しています。

連続修正(continuity correction)

正規分布は連続で、二項分布は離散です。P(X=50)P(X = 50) を正規近似で計算するとき、P(49.5Z50.5)P(49.5 \le Z \le 50.5) と計算すると精度が上がります。これを連続修正(continuity correction)といいます。nn が小さいほど差が大きくなります。

ポアソン近似: 稀な事象の極限

nn が大きく pp が小さい(経験則として n20n \ge 20 かつ p0.05p \le 0.05)とき、λ=np\lambda = np を固定したまま nn \to \inftyp0p \to 0 とする極限で B(n,p)B(n, p) はポアソン分布 Po(λ)\mathrm{Po}(\lambda) に収束します。

limnnp=λ(nk)pk(1p)nk=λkeλk!\lim_{\substack{n \to \infty \\ np = \lambda}} \binom{n}{k} p^k (1-p)^{n-k} = \frac{\lambda^k e^{-\lambda}}{k!}

この極限の直感は「稀な事象を多数回観測する」場面に対応します。1 日の交通事故件数(1 分ごとに「事故が起きる確率 pp」のベルヌーイ試行n=1440n = 1440 回繰り返す)や、1 ページ中のタイポ数、1 ヶ月のサーバー障害回数が典型例です。

ポアソン分布の期待値と分散はどちらも λ\lambda に等しく、Var[X]/E[X]=1\mathrm{Var}[X] / E[X] = 1 が成り立ちます。二項分布での比は Var[X]/E[X]=np(1p)/np=1p\mathrm{Var}[X] / E[X] = np(1-p) / np = 1-p であり、p0p \to 0 の極限でこれが 1 に収束することと一致します。

二項分布の 2 つの極限

nn 大・pp 中庸(np5np \ge 5 かつ n(1p)5n(1-p) \ge 5)のとき → 正規近似nn 大・pp 小(λ=np\lambda = np が定数)のとき → ポアソン近似。どちらの極限を取るかで適切な近似分布が変わります。

関連する用語

詳しくは