第4章 4-7 / 統計的仮説検定

2標本:母分散の比・母比率の差の検定 — F検定とZ検定

このページで学ぶこと

前回(4-6)は2標本の母平均の差を検定しました。本ページでは2標本のばらつきの比割合の差を検定します。第4章のラストです。

母分散の比には$F$ 分布を使い、検定統計量は $F=\dfrac{s_1^2}{s_2^2}$(自由度 $n_1-1,\,n_2-1$)。これは「2群のばらつきが等しいか」を調べる等分散性の検定で、4-6のプール $t$ を使ってよいかの判断材料になります。母比率の差は正規近似で、帰無仮説のもとでは2群を合わせたプールした比率 $\hat{p}=\dfrac{x_1+x_2}{n_1+n_2}$ で標準誤差を作るのがポイント。対応のある比率を扱うマクネマー検定も軽く紹介します。数値例まで計算しきります。

さえちゃん
さえ

第4章のフィナーレ! 今回は2群の「ばらつきの比」と「割合の差」だよ。分散の比は $F$ 分布──比だから差じゃなくて割り算。比率の差はちょっと変わってて、帰無仮説のもとでは2群を合体させたプールした比率で標準誤差を作るの。4-6の比率差(区間推定)と作り方が違うから、そこを見比べていこう!

1. 母分散の比:F検定(直感と統計量)

「2群のばらつきは等しいか?」を判定するのが、母分散の比 $\dfrac{\sigma_1^2}{\sigma_2^2}$ の検定です。平均と違って、ばらつきはではなくで比べるのが定石。帰無仮説は「ばらつきは等しい」、つまり $H_0:\sigma_1^2=\sigma_2^2$(言い換えると比が $1$)と置きます。

正規母集団からの2つの不偏分散 $s_1^2,s_2^2$ について、それぞれを母分散でスケールした $\chi^2$ どうしの比は $F$ 分布に従います(2-12)。$H_0$ のもとでは $\sigma_1^2=\sigma_2^2$ なので母分散が約分され、統計量は不偏分散の比そのものになります。

DERIVATION

$$ \begin{aligned} F &= \frac{(n_1-1)s_1^2/\sigma_1^2 \big/ (n_1-1)}{(n_2-1)s_2^2/\sigma_2^2 \big/ (n_2-1)} &&\text{(2つの } \chi^2 \text{ を自由度で割った比)}\\[4pt] &= \frac{s_1^2/\sigma_1^2}{s_2^2/\sigma_2^2} &&\text{(約分)}\\[4pt] &= \frac{s_1^2}{s_2^2} &&\text{(} H_0:\sigma_1^2=\sigma_2^2 \text{ で母分散が消える)} \end{aligned} $$

FORMULA

母分散の比の検定統計量(帰無仮説 $H_0:\sigma_1^2=\sigma_2^2$ のもとで) $$F = \frac{s_1^2}{s_2^2}\ \sim\ F_{\,n_1-1,\ n_2-1}$$ 分子の自由度が $n_1-1$、分母の自由度が $n_2-1$。比が $1$ から大きく離れるほど、ばらつきに差がある証拠になります。

2. F検定の棄却域

$F$ 分布も $0$ 以上で右に裾を引く左右非対称な分布です。両側検定では上下で別の点を使いますが、$F$ 分布表はふつう上側の点しか載っていないため、下側の点は「分子と分母を入れ替えた $F$ の逆数」で求めます。

F(1−α/2) F(α/2) 採択域 1−α α/2 α/2

F分布も非対称。両側検定の棄却域は左右で別の点。上側に α/2 を残す点が F(α/2)、下側に α/2 を残す点が F(1−α/2)

POINT

実務では、大きいほうの分散を分子に置くと $F\ge 1$ になり、上側だけ見ればよくなって楽です。その場合、両側 $\alpha$ の検定は上側 $\alpha/2$ 点 $F_{\alpha/2}(n_1-1,\,n_2-1)$ と比べ、これを超えれば棄却します。下側の点が要るときは $F_{1-\alpha/2}(n_1-1,\,n_2-1)=\dfrac{1}{F_{\alpha/2}(n_2-1,\,n_1-1)}$ で計算します(自由度の順が入れ替わる点に注意)。

3. F検定の数値例

EXAMPLE 1(等分散性の $F$ 検定)

2つのラインの製品ばらつきが等しいかを調べます。ライン1は $n_1=10$ 個で不偏分散 $s_1^2=64$、ライン2は $n_2=13$ 個で $s_2^2=20$。仮説は $H_0:\sigma_1^2=\sigma_2^2$、$H_1:\sigma_1^2\ne\sigma_2^2$、有意水準 $\alpha=0.05$ の両側です。

大きいほうの $s_1^2$ を分子に置くと $$F = \frac{s_1^2}{s_2^2} = \frac{64}{20} = 3.2$$ 自由度は分子 $n_1-1=9$、分母 $n_2-1=12$。両側 $5\%$ なので上側 $\alpha/2=0.025$ 点 $F_{0.025}(9,12)\approx 3.44$ と比べます。

$F=3.2<3.44$ なので棄却できません。「2ラインの分散が異なるとは言えない(等分散とみなしてよさそう)」。$p$ 値はおよそ $0.064$ で、$0.05$ をわずかに上回ります。比 $3.2$ はそこそこ大きく見えますが、自由度が小さいと $F$ のばらつきも大きいため、まだ有意とは言えないわけです。

POINT

この $F$ 検定の結論は、前回(4-6)の母平均の差でプール $t$(等分散)を使ってよいかの根拠になります。$F$ 検定で「等分散と言える」ならプール $t$、「等分散とは言えない」ならWelch、という流れです。ただし $F$ 検定は正規性に敏感なので、近年は最初からWelchを使う立場も一般的です。

4. 母比率の差:プールした比率で標準誤差を作る

2群の比率を比べる $p_1-p_2$ の検定です。各群の標本比率を $\hat{p}_1=\dfrac{x_1}{n_1}$、$\hat{p}_2=\dfrac{x_2}{n_2}$ とし、点推定値は差 $\hat{p}_1-\hat{p}_2$。標本が十分大きければ正規近似が使えます。帰無仮説は「2群の比率は等しい」つまり $H_0:p_1=p_2$。

ここがこの検定の核心です。$H_0$ が正しいなら2群の母比率は同じ共通の値 $p$ を持つはず。その共通の $p$ を、2群を合算して推定したものがプールした比率です。検定の標準誤差は、この共通比率から作ります。

FORMULA

プールした比率(2群の成功数・サンプル数を合算) $$\hat{p} = \frac{x_1+x_2}{n_1+n_2}$$ これを使って、帰無仮説 $H_0:p_1=p_2$ のもとでの標準誤差と検定統計量は $$Z = \frac{\hat{p}_1-\hat{p}_2}{\sqrt{\hat{p}(1-\hat{p})\left(\dfrac{1}{n_1}+\dfrac{1}{n_2}\right)}}\ \approx\ N(0,1)$$

POINT

区間推定(3-10)では各群の $\hat{p}_1,\hat{p}_2$ をそのまま標準誤差に使いましたが、検定ではプールした共通比率 $\hat{p}$ を使います。理由は1標本のとき(4-5)と同じで、検定は「$H_0$ が正しいと仮定したら?」を調べるから。$H_0:p_1=p_2$ のもとでは共通の $p$ があるので、それを2群まとめて推定するのが筋なのです。区間推定と検定で標準誤差の作り方が変わる──ここは頻出ポイントです。

さえちゃん
さえ

比率の差の検定、いちばんのポイントはプールした比率 $\hat{p}=\dfrac{x_1+x_2}{n_1+n_2}$! 帰無仮説は「2群の比率は同じ」だから、その同じ値を2群合体で推定して標準誤差を作るの。区間推定は群ごとの $\hat{p}_1,\hat{p}_2$、検定はプール──ここ、毎年のように出るよ。セットで覚えてね!

5. 母比率の差の数値例

EXAMPLE 2(母比率の差・正規近似)

新旧2つの広告で、クリック率に差があるかを調べます。広告1は $n_1=200$ 回表示で $x_1=120$ クリック($\hat{p}_1=0.60$)、広告2は $n_2=200$ 回表示で $x_2=92$ クリック($\hat{p}_2=0.46$)。仮説は $H_0:p_1=p_2$、$H_1:p_1\ne p_2$、有意水準 $\alpha=0.05$ の両側。

まずプールした比率を計算します。 $$\hat{p} = \frac{x_1+x_2}{n_1+n_2} = \frac{120+92}{200+200} = \frac{212}{400} = 0.53$$ 標準誤差は $$\sqrt{\hat{p}(1-\hat{p})\left(\frac{1}{n_1}+\frac{1}{n_2}\right)} = \sqrt{0.53\times 0.47\times\left(\frac{1}{200}+\frac{1}{200}\right)} = \sqrt{0.2491\times 0.01}\approx 0.04991$$ 検定統計量は $$Z = \frac{0.60-0.46}{0.04991} = \frac{0.14}{0.04991}\approx 2.805$$

両側 $5\%$ の棄却点 $z_{0.025}=1.96$。$|Z|=2.805>1.96$ なので帰無仮説を棄却し、「2つの広告のクリック率には差がある(広告1のほうが高い)」と判断します。$p$ 値はおよそ $0.005$ で、$0.05$ を大きく下回ります。

6. 対応のある比率:マクネマー検定(紹介)

§4・§5は2群が独立な場合でした。比率にも対応のある(対)ケースがあります。たとえば「同じ人に施策の前後で賛否を聞く」「同じ患者に2つの検査をかける」など。この場合は前後がペアで結びつくので、独立を前提にした正規近似は使えません。

対応のある比率を比べるにはマクネマー(McNemar)検定を使います。注目するのは、ペアで判定が変わった人だけです。下のような $2\times 2$ 表で、前は「Yes」だが後は「No」になった人数 $b$ と、その逆の $c$ に着目します。

後:Yes後:No
前:Yes$a$$b$
前:No$c$$d$
FORMULA

マクネマー検定の統計量(変化のあったペア $b,\,c$ だけを使う) $$\chi^2 = \frac{(b-c)^2}{b+c}\ \sim\ \chi^2_{1}$$ 判定が変わらなかった $a,\,d$ は式に入りません。自由度 $1$ の $\chi^2$ 分布で判定します。

POINT

マクネマー検定は2級では深入りせず、「対応のある比率には専用の検定(変化したペアだけを見る)がある」と押さえれば十分です。考え方は4-6の対応ある平均と同じ──ペア内の連動を無視せず活かす、という発想です。

7. 結論と使いどころ・まとめ

第4章を通じて、検定の骨格はずっと同じでした。「$H_0$ が正しいと仮定して検定統計量を作り、その統計量が従う分布で外れ具合を測り、棄却域に入れば $H_0$ を棄却する」。本ページで変わったのは、分散の比には $F$、比率の差には正規近似(プール比率)を使う、という統計量の作り方だけです。

POINT

本ページの2大注意点──(1) $F$ 検定は非対称ゆえ両側の棄却点が上下で別、下側は逆数+自由度入れ替えで作る。(2) 比率の差の検定はプールした比率 $\hat{p}=\dfrac{x_1+x_2}{n_1+n_2}$ で標準誤差を作る(区間推定の群別 $\hat{p}$ とは違う)。この2点が試験の頻出ポイントです。

第4章 4-7、ポイントを整理します。

これで第4章「統計的仮説検定」はひと区切りです。次回 5-1 単回帰モデル(最小二乗法) からは第5章。2変数の関係を直線で表す回帰分析に進みます。最小二乗法の正規方程式を導出し、これまでの推定・検定の道具が回帰係数の評価にそのまま生きてくる様子を見ていきます。

さえちゃん
さえ

第4章おつかれさま! ばらつきの比は $F$、割合の差はプール比率の正規近似──この2つで2標本検定はコンプリート。「検定はプール、区間推定は群別」、この合言葉だけは持って帰ってね。次はいよいよ回帰分析、データに直線を当てはめる世界だよ。お楽しみに!