2標本の区間推定 ─ 平均差・分散比・比率差
ここまでは1つの集団の母数を推定してきました。今回は2つの集団を比べる区間推定です。「新薬と旧薬で効果に差はあるか」「A工場とB工場でばらつきが違うか」「男女で支持率に差はあるか」──こうした問いに、差や比の信頼区間で答えます。
扱うのは3種類。母平均の差 $\mu_1-\mu_2$、母分散の比 $\dfrac{\sigma_1^2}{\sigma_2^2}$、母比率の差 $p_1-p_2$ です。とくに母平均の差は、分散が既知か・等分散か・対応があるかで式が枝分かれします。ケースごとに公式を表で整理しつつ、代表例を手計算して、最後に「区間が $0$(比なら $1$)を含むか」の読み方まで押さえましょう。1標本の考え方は 3-6〜3-8 が土台です。
2標本の区間推定は、公式がいっぱいで「うっ」となりがち。でも安心して! ぜんぶ「推定値 $\pm$ 係数 $\times$ 標準誤差」の形は同じだよ。違うのは中身の標準誤差と、どの分布表を引くか($z$・$t$・$F$)だけ。表で整理すれば一気にスッキリするから、一緒に並べていこう!
1. 母平均の差 ─ 4つのケース
2つの集団からそれぞれ標本を取り、母平均の差 $\mu_1-\mu_2$ を推定します。点推定値は標本平均の差 $\bar{X}_1-\bar{X}_2$。これを中心に区間を作りますが、標準誤差の中身と使う分布が状況で変わります。まず全体像を表で見ましょう。$\bar{X}_1,\bar{X}_2$ は各群の標本平均、$n_1,n_2$ は各群のデータ数です。
| 状況 | 標準誤差($\bar{X}_1-\bar{X}_2$ の) | 使う分布 |
|---|---|---|
| 母分散 $\sigma_1^2,\sigma_2^2$ が既知(正規) | $\sqrt{\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}}$ | 標準正規 $z$ |
| 分散未知だが等分散 $\sigma_1^2=\sigma_2^2$ | $s_p\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}$ | $t$(自由度 $n_1+n_2-2$) |
| 分散未知で等分散も仮定しない(Welch) | $\sqrt{\dfrac{s_1^2}{n_1}+\dfrac{s_2^2}{n_2}}$ | $t$(自由度は近似式) |
| 対応のある2標本 | 差 $D$ の1標本問題に帰着(§2) | $t$(自由度 $n-1$) |
ケース1:母分散が既知(正規母集団)
$\sigma_1^2,\sigma_2^2$ が分かっている理想的な場合です。差の分散は「それぞれの分散を $n$ で割ったものの和」になります(標本平均が独立なら分散は足せる、という 2-5c の性質を使います)。
$$(\bar{X}_1-\bar{X}_2)\ \pm\ z_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}$$ $z_{\alpha/2}$ は標準正規分布の上側 $\alpha/2$ 点($95\%$ なら $1.96$)です。
ケース2:等分散を仮定(プールした分散 + $t$)
母分散は未知だが「2群のばらつきは等しい」と見なせるとき。2群のデータを合わせて共通の分散を推定すると、情報を無駄なく使えます。この合算した分散推定量をプールした分散 $s_p^2$ といい、各群の不偏分散 $s_1^2,s_2^2$ を自由度で重み付けして平均します。
プールした分散 $$s_p^2 = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2}$$ を使って $$(\bar{X}_1-\bar{X}_2)\ \pm\ t_{\alpha/2}(n_1+n_2-2)\ s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}$$ 自由度は $n_1+n_2-2$(各群で1つずつ平均を推定したぶん $2$ 減る)です。
$s_p^2$ は $s_1^2$ と $s_2^2$ の自由度 $(n_1-1),(n_2-1)$ を重みにした加重平均です。データ数が多い群の分散ほど信頼できるので、重く扱うわけです。
ケース3:等分散を仮定しない(Welch法)
2群のばらつきが明らかに違いそうなときは、無理に等分散を仮定せず、各群の分散をそのまま使います。これがWelch(ウェルチ)の方法。標準誤差はケース1の $\sigma$ を $s$ に置き換えた素直な形ですが、自由度が整数にならず、次の近似式(Welch–Satterthwaite)で求めます。
$$(\bar{X}_1-\bar{X}_2)\ \pm\ t_{\alpha/2}(\nu)\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}$$ 近似自由度 $$\nu = \frac{\left(\dfrac{s_1^2}{n_1}+\dfrac{s_2^2}{n_2}\right)^{2}}{\dfrac{1}{n_1-1}\left(\dfrac{s_1^2}{n_1}\right)^{2}+\dfrac{1}{n_2-1}\left(\dfrac{s_2^2}{n_2}\right)^{2}}$$ ($\nu$ は通常は小数になるので、切り捨てて使うか、そのまま $t$ 分布表を補間します。)
2. 対応のある2標本 ─ 差の1標本問題に帰着
ここが2標本でいちばん混乱しやすいポイントです。対応のある(対)データとは、同じ対象を2回測ったような、ペアで結びついたデータのこと。たとえば「同じ人の服用前 $X$ と服用後 $Y$」「同じ畑の去年 $X$ と今年 $Y$」です。ペアどうしは独立ではありません。
対応があるときは、ペアごとに差 $D_i = X_i - Y_i$ を取って、1つの変数として扱うのがコツです。すると「差 $D$ の母平均 $\mu_D$ を推定する」という、ただの1標本の問題(3-7)に早変わり。2標本の難しさが消えてしまいます。
差 $D_i=X_i-Y_i$ の標本平均を $\bar{D}$、不偏分散を $s_D^2$、ペア数を $n$ とすると、$\mu_D=\mu_1-\mu_2$ の信頼区間は $$\bar{D}\ \pm\ t_{\alpha/2}(n-1)\,\frac{s_D}{\sqrt{n}}$$ 自由度は $n-1$(差のデータは $n$ 個)です。
対応あり/なしの取り違えは頻出ミスです。見分け方はシンプルで、「2つの標本がペアで自然に結びつくか」。結びつくなら対応あり(差を取る)、まったく別の対象どうしなら対応なし(§1の独立2標本)。対応があるのに独立として計算すると、ペア内の連動を無視してしまい、区間が不必要に広くなって差を見逃しやすくなります。
「同じ人を前後で測った?」がキーワード! Yesなら対応あり → 差 $D$ を取って1標本に変身。Noなら対応なし → §1の独立2標本。ここを間違えると公式ごと変わっちゃうから、問題文で「ペアになってるか」を真っ先にチェックしてね!
3. 母分散の比 ─ $F$ 分布を使う
「2群のばらつきは等しいか?」を区間で答えるのが、母分散の比 $\dfrac{\sigma_1^2}{\sigma_2^2}$ の推定です。差ではなく比を見るのがポイント。2つの不偏分散の比 $\dfrac{s_1^2}{s_2^2}$ が $F$ 分布にしたがう、という事実(2-12)を使います。
$F_{\alpha/2}(\,\cdot\,,\,\cdot\,)$ を $F$ 分布の上側 $\alpha/2$ 点とすると、$\dfrac{\sigma_1^2}{\sigma_2^2}$ の信頼区間は $$\frac{s_1^2}{s_2^2}\cdot\frac{1}{F_{\alpha/2}(n_1-1,\,n_2-1)} \ \le\ \frac{\sigma_1^2}{\sigma_2^2}\ \le\ \frac{s_1^2}{s_2^2}\cdot F_{\alpha/2}(n_2-1,\,n_1-1)$$ 上限と下限で自由度の順序が入れ替わることに注意してください。
自由度が入れ替わるのは、$F$ 分布が左右非対称で、下側の点を「分子と分母を入れ替えた $F$ の逆数」として扱うためです。だから比の区間は、差の区間と違って中心が $1$ の左右に対称ではない形になります。
母分散の比の区間が $1$ を含むかが読みどころです。$1$ を含めば「2群の分散は等しいと言ってよさそう」、含まなければ「ばらつきに差がある」。§1のケース2(等分散プール $t$)を使ってよいかの目安にもなります。
4. 母比率の差 ─ 正規近似
2群の比率を比べる $p_1-p_2$ の推定です。各群の標本比率 $\hat{p}_1,\hat{p}_2$ の差を点推定値とし、標本サイズが十分大きければ正規近似(3-8 の1標本比率の2群版)が使えます。
$$(\hat{p}_1-\hat{p}_2)\ \pm\ z_{\alpha/2}\sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{n_1}+\frac{\hat{p}_2(1-\hat{p}_2)}{n_2}}$$ 標準誤差は、各群の比率の分散 $\dfrac{\hat{p}(1-\hat{p})}{n}$ を足して平方根を取った形です(2群が独立なら分散は足せる)。
区間推定では各群の $\hat{p}$ をそのまま標準誤差に使います(検定のときに出てくる「プールした比率」とは別なので混同しないでください)。正規近似が使えるのは、各群で「成功数も失敗数もおおむね $5$ 以上」が目安です。
5. 数値例
代表的なケースを実際に計算します。まずは母平均の差(等分散プール $t$)から。
A組 $n_1=10$ 人で平均 $\bar{X}_1=72$、不偏分散 $s_1^2=64$($s_1=8$)。B組 $n_2=12$ 人で平均 $\bar{X}_2=66$、不偏分散 $s_2^2=100$($s_2=10$)。等分散を仮定して $\mu_1-\mu_2$ の $95\%$ 信頼区間を求めます。
まずプールした分散を計算します。 $$s_p^2 = \frac{(10-1)\times 64 + (12-1)\times 100}{10+12-2} = \frac{576+1100}{20} = \frac{1676}{20} = 83.8$$ $$s_p = \sqrt{83.8}\approx 9.154$$ 自由度は $n_1+n_2-2=20$ なので $t_{0.025}(20)\approx 2.086$。標準誤差は $$s_p\sqrt{\frac{1}{10}+\frac{1}{12}} = 9.154\times\sqrt{0.1833} \approx 9.154\times 0.4282 \approx 3.920$$ 点推定値 $\bar{X}_1-\bar{X}_2 = 72-66 = 6$ を中心に、 $$6 \pm 2.086\times 3.920 = 6 \pm 8.18$$ よって $95\%$ 信頼区間は $\ -2.18 \le \mu_1-\mu_2 \le 14.18$。
区間が $0$ をまたいでいるので、「2組の平均に差があるとは言い切れない」と読めます。
同じデータで、ばらつきに差があるかを $\dfrac{\sigma_1^2}{\sigma_2^2}$ の区間で確かめます。$\dfrac{s_1^2}{s_2^2}=\dfrac{64}{100}=0.64$。$F_{0.025}(9,11)\approx 3.588$、$F_{0.025}(11,9)\approx 3.912$ を使うと $$0.64\times\frac{1}{3.588} \ \le\ \frac{\sigma_1^2}{\sigma_2^2}\ \le\ 0.64\times 3.912$$ $$0.18 \ \le\ \frac{\sigma_1^2}{\sigma_2^2}\ \le\ 2.50$$
区間が $1$ を含むので、「2組の分散は等しいと見なしてよさそう」。EXAMPLE 1 で等分散を仮定したことが、ここで裏づけられました。
商品Pの認知度を2地域で調査。地域1は $n_1=220$ 人中 $132$ 人が「知っている」($\hat{p}_1=0.6$)、地域2は $n_2=210$ 人中 $84$ 人($\hat{p}_2=0.4$)。$p_1-p_2$ の $95\%$ 信頼区間は($z_{0.025}=1.96$) $$\text{標準誤差} = \sqrt{\frac{0.6\times 0.4}{220}+\frac{0.4\times 0.6}{210}} \approx \sqrt{0.001091+0.001143} \approx \sqrt{0.002234}\approx 0.04726$$ $$(0.6-0.4) \pm 1.96\times 0.04726 = 0.2 \pm 0.093$$ よって $0.107 \le p_1-p_2 \le 0.293$。
区間が $0$ を含まないので、「地域1のほうが認知度が高いと言ってよさそう」と判断できます。
$8$ 人の被験者について、トレーニング前後の記録の差 $D=\text{後}-\text{前}$ を測ったところ $$D:\ 3,\ 5,\ -1,\ 4,\ 2,\ 6,\ 0,\ 3$$ 平均は $\bar{D}=\dfrac{22}{8}=2.75$、不偏分散から $s_D\approx 2.375$。ペア数 $n=8$、自由度 $7$ で $t_{0.025}(7)\approx 2.365$。標準誤差は $\dfrac{s_D}{\sqrt{n}}=\dfrac{2.375}{\sqrt{8}}\approx 0.840$。 $$2.75 \pm 2.365\times 0.840 = 2.75 \pm 1.99$$ よって $0.76 \le \mu_D \le 4.74$。
区間が $0$ を含まないので、「トレーニングで記録が向上したと言ってよさそう」。同じデータを誤って独立2標本として扱うと標準誤差が大きくなり、この明確な差を見逃しかねません。対応はちゃんと活かすことが大切です。
6. 結論と使いどころ
公式はたくさんありますが、骨格はすべて「点推定値 $\pm$($z$ または $t$)$\times$ 標準誤差」で共通です。違うのは、(1) 標準誤差の中身、(2) $z/t/F$ のどれを引くか、(3) 自由度、の3点だけ。ここを表で押さえておけば、本番では状況判定 → 公式選択 → 代入、の流れ作業で解けます。
最後は区間が基準値を含むかで読み解きます。差(平均差・比率差)なら$0$ を含むか、比(分散比)なら$1$ を含むか。含めば「差があるとは言えない」、含まなければ「差があると言ってよさそう」。これは第4章で学ぶ仮説検定の結論と表裏一体で、区間推定はいわば「検定の答えを範囲で見せたもの」なのです。
まとめ
第3章 3-10、ポイントを整理します。
- 母平均の差:分散既知→$z$、等分散→プール $s_p^2$ と $t$(自由度 $n_1+n_2-2$)、不等分散→Welch(近似自由度)
- 対応あり:差 $D=X-Y$ を取り、$\bar{D}\pm t_{\alpha/2}(n-1)\dfrac{s_D}{\sqrt{n}}$ で1標本問題に帰着
- 対応あり/なしの判定:ペアで結びつくなら対応あり。取り違えは頻出ミス
- 母分散の比:$\dfrac{s_1^2}{s_2^2}$ と $F$ 分布。上限・下限で自由度の順が入れ替わる
- 母比率の差:正規近似で $(\hat{p}_1-\hat{p}_2)\pm z_{\alpha/2}\sqrt{\dfrac{\hat{p}_1(1-\hat{p}_1)}{n_1}+\dfrac{\hat{p}_2(1-\hat{p}_2)}{n_2}}$
- 読み方:差は $0$、比は $1$ を含むかで「差があると言えるか」を判断
これで第3章「統計的推定」はひと区切りです。次回 4-1 仮説検定の考え方 からは第4章。「差があると言えるか」をイエス/ノーで判断する仮説検定に進みます。区間推定で身につけた標準誤差や $t/F$ の感覚が、そのまま検定統計量の理解につながりますよ。
公式の数に圧倒されないで! 「$\pm$ 係数 $\times$ 標準誤差」の形はぜんぶ一緒、変わるのは中身だけ。差なら $0$、比なら $1$ を含むかで読む──この合言葉だけ持って帰ってね。第3章おつかれさま、次はいよいよ検定だよ!