大数法則と中心極限定理
コインを 100 回投げて表がちょうど 50 回でも、それは偶然の一致にすぎません。10,000 回投げれば表の割合は 0.5 のすぐ近くまで安定します。大数の法則 (LLN) は標本平均が母平均に確率収束することを、中心極限定理 (CLT) は標本平均の分布が元の分布によらず正規分布に近づくことを保証します。両者は同じ標本平均についての別方向の主張で、LLN は中心への収束、CLT は分布形の収束です。ばらつきがサンプル数の平方根に反比例して縮む構造が Part 3(標本誤差・信頼区間・検定)の土台になります。i.i.d. と有限分散の前提が崩れる場合(Cauchy 分布・fat tail・独立性崩壊)は成り立ちません。
条件付き確率とベイズの面積
90% 当たる検査で陽性が出ても、本当に病気である確率は約 9.2% にとどまります。条件付き確率とベイズの定理を 1×1 矩形の分割として扱い、事前確率・尤度・事後確率の関係を「縦帯と横帯の面積比較」として読み解きます。ベイズの定理は条件付き確率の定義から直接導かれる初等的命題で、矩形を 2 通りに読んだときの整合性が要求する関係として導出します。独立性は「条件付けても確率が変わらない関係」として定義し、排反性との混同・基準率の無視・確率の更新までを離散の範囲で整理します。
期待値
サイコロを 1 回振ったときの期待値は 3.5 ですが、3.5 という目はサイコロに存在しません。「期待値」が指すのは 1 回の結果ではなく、無限回繰り返したときの平均値です。stats-01 の度数分布表で度数が果たしていた重みを stats-05 の確率に置き換えた構造、確率変数と実現値の記号区別、独立でなくても成り立つ線形性、二項分布の期待値を 2 行で導く威力までを離散の範囲で整理します。
確率の直感
コインを 100 回投げて 57 回表が出たら、このコインは偏っているのでしょうか。素朴な「半分のはず」は確率という言葉の中身を取り違えた直感で、無限回試行の極限(頻度主義)と賭けに応じる比率(主観確率)の 2 つの中身に切り分ける必要があります。両者は Kolmogorov 三公理という共通の土台で計算され、別の問いにそれぞれ答えます。
標準化と z スコア
単位もスケールも違う数字を 1 つの軸に乗せる道具が標準化です。平均を原点に、標準偏差を 1 単位に置き直すと、数字は「平均から何 σ 離れているか」だけで語れます。stats-03 の歪度・尖度が「すでに標準化された量」だったことまで回収します。
分布の形を見る
平均と標準偏差が同じでも、分布の形が違えばデータの意味は違います。ヒストグラムから密度関数まで、形を見る道具と、形を 1 つの数で要約する歪度・超過尖度を順に学びます。
散らばりの測り方
範囲・四分位・分散・標準偏差。「なぜ二乗するのか」を平方完成で証明し、絶対値ではなく二乗を選ぶ構造的な理由を掘ります。
平均値と中央値の使い分け
外れ値 1 つで平均は化けますが、中央値は化けません。所得分布・バイト時給の例で、2 つの代表値がいつ食い違い、どちらを使うべきかを掘ります。