第6章 6-4 / 正規性・適合度・独立性のχ²検定

独立性の検定 — 分割表で2変数の独立を調べる

このページで学ぶこと

1-12 クロス集計表で、2つの質的変数のクロス表を眺めて「関連がありそう/なさそう」と感覚的に判断しました。本ページでは、その「関連」を統計的に判定します。これが独立性の検定です。本編の最終記事、いよいよ総仕上げです。

使う統計量は前回 6-3 適合度の検定とまったく同じ $\displaystyle \chi^2=\sum_i\sum_j\frac{(O_{ij}-E_{ij})^2}{E_{ij}}$ の形。違うのは期待度数 $E_{ij}$ の作り方だけです。「もし2変数が独立だったら、各マスは何個になるはずか」を計算し、観測度数とのズレを $\chi^2$ で測ります。期待度数の式 $E_{ij}=\dfrac{(\text{行和}_i)\times(\text{列和}_j)}{\text{総和}}$ がどこから来るのか、独立の定義からきちんと導いていきましょう。

さえちゃん
さえ

独立性の検定は、6-3 の適合度検定の「分割表バージョン」だよ。$\chi^2$ の式は同じ。ポイントは期待度数を「行和 × 列和 ÷ 総和」で作ること。これが「2変数が独立だったらこうなるはず」っていう理論値なんだ。式の意味がわかれば暗記いらずだよ!

1. 何を検定するのか(直感)

たとえば「ある薬を投与したかどうか(処置あり/なし)」と「回復したかどうか(回復/非回復)」という2つの質的変数があるとします。これらを分割表(クロス集計表)にまとめ、薬と回復に関連があるか=独立でないかを調べたい。これが独立性の検定の典型場面です。

POINT

独立性の検定とは、分割表でまとめた2つの質的変数が独立かどうかを調べる検定です。仮説は次のように置きます。
・帰無仮説 $H_0$:2つの変数は独立である(関連がない)
・対立仮説 $H_1$:2つの変数は独立でない(関連がある)

ここで $r$ 行 $c$ 列の分割表を考え、第 $i$ 行・第 $j$ 列のマス(セル)の観測度数を $O_{ij}$ と書きます。行ごとの合計(行和)、列ごとの合計(列和)、全体の合計(総和 $n$)を周辺度数と呼ぶのは、1-12で見たとおりです。検定の戦略は適合度検定と同じ。「もし独立なら各セルは何個になるはずか」という期待度数 $E_{ij}$ を作り、観測とのズレを $\chi^2$ で測ります。

2. 期待度数 $E_{ij}$ の導出★

では「独立だったときの期待度数」を、独立の定義から導きます。ここが本ページの山場です。

ステップ1:独立なら同時確率は積

2つの事象が独立であるとは、同時に起こる確率が、それぞれの確率の積に等しいことでした(2-2 乗法定理)。第 $i$ 行に入る確率を $p_{i\cdot}$、第 $j$ 列に入る確率を $p_{\cdot j}$ とすると、独立のもとでセル $(i,j)$ に入る確率は

DERIVATION

$$ \begin{aligned} p_{ij} &= p_{i\cdot}\times p_{\cdot j} &&\text{(独立なら同時確率は周辺確率の積)}\\[2pt] E_{ij} &= n\, p_{ij} = n\, p_{i\cdot}\, p_{\cdot j} &&\text{(期待度数は総数 } n \text{ と確率の積)} \end{aligned} $$ ここで行・列の確率は周辺度数から推定します。第 $i$ 行の確率は「行和 $\div$ 総和」、第 $j$ 列の確率は「列和 $\div$ 総和」と見積もれるので、 $$ \begin{aligned} p_{i\cdot} &= \frac{(\text{行和}_i)}{n}, \qquad p_{\cdot j} = \frac{(\text{列和}_j)}{n}\\[6pt] E_{ij} &= n\times \frac{(\text{行和}_i)}{n}\times \frac{(\text{列和}_j)}{n} = \frac{(\text{行和}_i)\times(\text{列和}_j)}{n} \end{aligned} $$

FORMULA

独立を仮定したときの期待度数: $$E_{ij} = \frac{(\text{行和}_i)\times(\text{列和}_j)}{(\text{総和})}$$ 各セルの期待度数は「そのセルの属する行の合計」と「列の合計」を掛けて、総和で割るだけ。覚えやすい形ですが、出どころは独立なら同時確率は周辺確率の積という定義です。

この式が「丸暗記の公式」ではなく、独立の定義から自然に出てくることが見えたでしょうか。$\sum p_i = 1$ や周辺確率の考え方は1-12そのもの。期待度数 $E_{ij}$ は「行の比率と列の比率が独立に効いた、理想の分割表」を表しているのです。

3. 検定統計量と自由度

期待度数さえできれば、あとは適合度検定とまったく同じです。観測度数とのズレを「標準化したズレの二乗」として全セル分足し合わせます。

FORMULA

独立性検定の検定統計量: $$\chi^2 = \sum_{i=1}^{r}\sum_{j=1}^{c} \frac{(O_{ij}-E_{ij})^2}{E_{ij}}$$ $H_0$(独立)が正しいとき、この統計量は近似的に自由度 $(r-1)(c-1)$ の $\chi^2$ 分布に従います。

自由度がなぜ $(r-1)(c-1)$ になるのかも、適合度検定の考え方の延長です。期待度数は行和・列和(周辺度数)をデータから決めて作るので、その分の縛りが入ります。$r\times c$ 個のセルのうち、行和を固定すると各行で自由に動けるのは $c-1$ 個、列和も固定すると行方向でも $r-1$ 行ぶんだけ、というように縛りが効き、結局自由に動けるのは $(r-1)\times(c-1)$ 個ぶん、と理解できます。

FORMULA

$$(\text{自由度}) = (r-1)(c-1)$$ $r$ は行数、$c$ は列数。たとえば $2\times2$ 表なら $(2-1)(2-1)=1$、$2\times3$ 表なら $(2-1)(3-1)=2$、$3\times3$ 表なら $(3-1)(3-1)=4$ です。

4. 数値例:$2\times2$ 表

判定はやはり右片側です。$\chi^2$ がその自由度の上側 $\alpha$ 点 $\chi^2_\alpha$ を超えたら $H_0$(独立)を棄却し、「関連あり」と結論します。

EXAMPLE 1(処置と回復の関連:2×2)

ある治療法の効果を調べ、$140$ 人について「処置あり/なし」と「回復/非回復」を集計したところ、次の分割表になりました。処置と回復は独立か、有意水準 $5\%$ で検定します。

観測 $O_{ij}$回復非回復行和
処置あり402060
処置なし305080
列和7070140

期待度数は $E_{ij}=\dfrac{(\text{行和}_i)\times(\text{列和}_j)}{140}$ で計算します。たとえば「処置あり・回復」は $E_{11}=\dfrac{60\times70}{140}=30$。同様に全セルを埋めます。

期待 $E_{ij}$回復非回復
処置あり3030
処置なし4040

各セルの寄与 $\dfrac{(O_{ij}-E_{ij})^2}{E_{ij}}$ を足し合わせます。 $$ \begin{aligned} \chi^2 &= \frac{(40-30)^2}{30}+\frac{(20-30)^2}{30}+\frac{(30-40)^2}{40}+\frac{(50-40)^2}{40}\\[2pt] &= \frac{100}{30}+\frac{100}{30}+\frac{100}{40}+\frac{100}{40}\\[2pt] &= 3.333+3.333+2.5+2.5 = 11.667 \end{aligned} $$ 自由度は $(2-1)(2-1)=1$。$\chi^2$ 分布の上側 $5\%$ 点は $\chi^2_{0.05}(1)=3.841$ です。

$11.667 > 3.841$ なので棄却域に入り、$H_0$ を棄却します($p$ 値 $\approx 0.0006$)。すなわち「処置と回復には関連がある(独立でない)」と結論できます。観測表で「処置ありは回復が多い」という見た目の傾向が、偶然では説明できない、ということです。

χ²₀.₀₅(1)=3.84 11.67 棄却域 5%

自由度1のχ²分布。観測値11.67は棄却域(3.84より右)に深く入り、H₀(独立)は棄却される

5. 数値例:$2\times3$ 表

列が増えても手順はまったく同じです。今度は $2\times3$ 表で確かめます。

EXAMPLE 2(性別と学習時間帯の関連:2×3)

$250$ 人について「性別」と「学習しやすい時間帯(朝/昼/夜)」を集計しました。性別と時間帯は独立か、有意水準 $5\%$ で検定します。

観測 $O_{ij}$行和
男性754827150
女性253243100
列和1008070250

期待度数は $E_{ij}=\dfrac{(\text{行和}_i)\times(\text{列和}_j)}{250}$。たとえば $E_{11}=\dfrac{150\times100}{250}=60$、$E_{12}=\dfrac{150\times80}{250}=48$ という具合です。

期待 $E_{ij}$
男性604842
女性403228

各セルの寄与を足し合わせます($E=48$ の列はズレが $0$ なので寄与もゼロ)。 $$ \begin{aligned} \chi^2 &= \frac{(75-60)^2}{60}+0+\frac{(27-42)^2}{42}+\frac{(25-40)^2}{40}+0+\frac{(43-28)^2}{28}\\[2pt] &= 3.75+0+5.357+5.625+0+8.036 = 22.768 \end{aligned} $$ 自由度は $(2-1)(3-1)=2$。上側 $5\%$ 点は $\chi^2_{0.05}(2)=5.991$ です。

$22.768 > 5.991$ なので$H_0$ を棄却します($p$ 値 $\approx 0.00001$)。性別と学習しやすい時間帯には関連がある、と結論できます。

さえちゃん
さえ

6-3 と 6-4 の違いは一点だけ! 適合度は期待度数を「理論の確率 × $n$」で作る。独立性は「行和 × 列和 ÷ 総和」で作る。あとの $\chi^2$ の足し算も、右片側で上側 $\alpha$ 点と比べるのも、ぜんぶ同じ。期待度数の作り方さえ押さえれば、両方マスターしたも同然だよ!

6. 関連の「強さ」:クラメールの連関係数 $V$

独立性の検定で「関連あり」と判定できても、$\chi^2$ の値そのものは関連の強さを直接は表しません。$\chi^2$ はサンプルサイズ $n$ が大きいほど大きくなりやすいからです。そこで、関連の強さを $0$〜$1$ の物差しで測る指標がクラメールの連関係数 $V$ です。

FORMULA

$$V = \sqrt{\frac{\chi^2}{n\,(\min(r,c)-1)}}$$ ここで $\min(r,c)$ は行数 $r$ と列数 $c$ の小さいほう。$V$ は $0$(まったく無関連)から $1$(完全な関連)の値をとり、相関係数の質的変数版のように関連の強さを表します。

EXAMPLE 1($2\times2$、$\chi^2=11.667$、$n=140$)で計算すると、$\min(r,c)=2$ なので $$V=\sqrt{\frac{11.667}{140\times(2-1)}}=\sqrt{0.0833}\approx 0.29$$ EXAMPLE 2($2\times3$、$\chi^2=22.768$、$n=250$)でも $\min(r,c)=2$ なので $V=\sqrt{\dfrac{22.768}{250\times1}}\approx 0.30$ です。どちらも「中程度の関連」といえる水準です。検定で関連の有無を判定し、$V$ で関連の強さを補足する──この2段構えが実務での定番です。

まとめ

第6章 6-4、ポイントを整理します。

これで本編全6章が完結です。記述統計から確率、推定・検定、回帰、そして $\chi^2$ 検定まで──「公式の暗記」ではなく「なぜその式になるのか」を一歩ずつ追ってきました。$\chi^2$ 検定の期待度数も、独立の定義から導けば自然な式でしたね。ここまで積み上げた導出の力は、過去問演習でもきっと効いてきます。統計検定2級トップから、気になる章をいつでも復習してください。本当におつかれさまでした!

さえちゃん
さえ

ついに本編コンプリート、おめでとう! $\chi^2$ 検定の「期待度数を作って、ズレを二乗して足す」流れ、もう自分の手で書けるよね。あとは過去問でこの流れを体に染み込ませよう。わからなくなったらいつでも各章に戻ってきてね。あなたの合格、心から応援してるよ!