第3章 3-10 / 統計的推定

2標本の区間推定 ─ 平均差・分散比・比率差

さえ

2標本の区間推定は、公式がいっぱいで「うっ」となりがち。でも安心して！　ぜんぶ「推定値 $\pm$ 係数 $\times$ 標準誤差」の形は同じだよ。違うのは中身の標準誤差と、どの分布表を引くか（$z$・$t$・$F$）だけ。表で整理すれば一気にスッキリするから、一緒に並べていこう！

1. 母平均の差 ─ 4つのケース

2つの集団からそれぞれ標本を取り、母平均の差 $\mu_1-\mu_2$ を推定します。点推定値は標本平均の差 $\bar{X}_1-\bar{X}_2$。

これを中心に区間を作りますが、標準誤差の中身と使う分布が状況で変わります。まず全体像を表で見ましょう。$\bar{X}_1,\bar{X}_2$ は各群の標本平均、$n_1,n_2$ は各群のデータ数です。

状況	標準誤差（$\bar{X}_1-\bar{X}_2$ の）	使う分布
母分散 $\sigma_1^2,\sigma_2^2$ が既知（正規）	$\sqrt{\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}}$	標準正規 $z$
分散未知だが等分散 $\sigma_1^2=\sigma_2^2$	$s_p\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}$	$t$（自由度 $n_1+n_2-2$）
分散未知で等分散も仮定しない（Welch）	$\sqrt{\dfrac{s_1^2}{n_1}+\dfrac{s_2^2}{n_2}}$	$t$（自由度は近似式）
対応のある2標本	差 $D$ の1標本問題に帰着（§2）	$t$（自由度 $n-1$）

ケース1：母分散が既知（正規母集団）

$\sigma_1^2,\sigma_2^2$ が分かっている理想的な場合です。差の分散は「それぞれの分散を $n$ で割ったものの和」になります（標本平均が独立なら分散は足せる、という 2-5c の性質を使います）。

FORMULA

$$(\bar{X}_1-\bar{X}_2)\ \pm\ z_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}$$ $z_{\alpha/2}$ は標準正規分布の上側 $\alpha/2$ 点（$95\%$ なら $1.96$）です。

ケース2：等分散を仮定（プールした分散 + $t$）

母分散は未知だが「2群のばらつきは等しい」と見なせるとき。2群のデータを合わせて共通の分散を推定すると、情報を無駄なく使えます。

この合算した分散推定量をプールした分散 $s_p^2$ といい、各群の不偏分散 $s_1^2,s_2^2$ を自由度で重み付けして平均します。

FORMULA

プールした分散 $$s_p^2 = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2}$$ を使って $$(\bar{X}_1-\bar{X}_2)\ \pm\ t_{\alpha/2}(n_1+n_2-2)\ s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}$$ 自由度は $n_1+n_2-2$（各群で1つずつ平均を推定したぶん $2$ 減る）です。

$s_p^2$ は $s_1^2$ と $s_2^2$ の自由度 $(n_1-1),(n_2-1)$ を重みにした加重平均です。データ数が多い群の分散ほど信頼できるので、重く扱うわけです。

ケース3：等分散を仮定しない（Welch法）

2群のばらつきが明らかに違いそうなときは、無理に等分散を仮定せず、各群の分散をそのまま使います。これがWelch（ウェルチ）の方法。

標準誤差はケース1の $\sigma$ を $s$ に置き換えた素直な形ですが、自由度が整数にならず、次の近似式（Welch–Satterthwaite）で求めます。

FORMULA

$$(\bar{X}_1-\bar{X}_2)\ \pm\ t_{\alpha/2}(\nu)\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}$$ 近似自由度 $$\nu = \frac{\left(\dfrac{s_1^2}{n_1}+\dfrac{s_2^2}{n_2}\right)^{2}}{\dfrac{1}{n_1-1}\left(\dfrac{s_1^2}{n_1}\right)^{2}+\dfrac{1}{n_2-1}\left(\dfrac{s_2^2}{n_2}\right)^{2}}$$ （$\nu$ は通常は小数になるので、切り捨てて使うか、そのまま $t$ 分布表を補間します。）

2. 対応のある2標本 ─ 差の1標本問題に帰着

ここが2標本でいちばん混乱しやすいポイントです。対応のある（対）データとは、同じ対象を2回測ったような、ペアで結びついたデータのこと。たとえば「同じ人の服用前 $X$ と服用後 $Y$」「同じ畑の去年 $X$ と今年 $Y$」です。ペアどうしは独立ではありません。

POINT

対応があるときは、ペアごとに差 $D_i = X_i - Y_i$ を取って、1つの変数として扱うのがコツです。すると「差 $D$ の母平均 $\mu_D$ を推定する」という、ただの1標本の問題（3-7）に早変わり。2標本の難しさが消えてしまいます。

FORMULA

差 $D_i=X_i-Y_i$ の標本平均を $\bar{D}$、不偏分散を $s_D^2$、ペア数を $n$ とすると、$\mu_D=\mu_1-\mu_2$ の信頼区間は $$\bar{D}\ \pm\ t_{\alpha/2}(n-1)\,\frac{s_D}{\sqrt{n}}$$ 自由度は $n-1$（差のデータは $n$ 個）です。

POINT

対応あり／なしの取り違えは頻出ミスです。見分け方はシンプルで、「2つの標本がペアで自然に結びつくか」。結びつくなら対応あり（差を取る）、まったく別の対象どうしなら対応なし（§1の独立2標本）。対応があるのに独立として計算すると、ペア内の連動を無視してしまい、区間が不必要に広くなって差を見逃しやすくなります。

さえ

「同じ人を前後で測った？」がキーワード！　Yesなら対応あり → 差 $D$ を取って1標本に変身。Noなら対応なし → §1の独立2標本。ここを間違えると公式ごと変わっちゃうから、問題文で「ペアになってるか」を真っ先にチェックしてね！

3. 母分散の比 ─ $F$ 分布を使う

「2群のばらつきは等しいか？」を区間で答えるのが、母分散の比 $\dfrac{\sigma_1^2}{\sigma_2^2}$ の推定です。

差ではなく比を見るのがポイント。2つの不偏分散の比 $\dfrac{s_1^2}{s_2^2}$ が $F$ 分布にしたがう、という事実（2-12）を使います。

FORMULA

$F_{\alpha/2}(\,\cdot\,,\,\cdot\,)$ を $F$ 分布の上側 $\alpha/2$ 点とすると、$\dfrac{\sigma_1^2}{\sigma_2^2}$ の信頼区間は $$\frac{s_1^2}{s_2^2}\cdot\frac{1}{F_{\alpha/2}(n_1-1,\,n_2-1)} \ \le\ \frac{\sigma_1^2}{\sigma_2^2}\ \le\ \frac{s_1^2}{s_2^2}\cdot F_{\alpha/2}(n_2-1,\,n_1-1)$$ 上限と下限で自由度の順序が入れ替わることに注意してください。

自由度が入れ替わるのは、$F$ 分布が左右非対称で、下側の点を「分子と分母を入れ替えた $F$ の逆数」として扱うためです。だから比の区間は、差の区間と違って中心が $1$ の左右に対称ではない形になります。

POINT

母分散の比の区間が $1$ を含むかが読みどころです。$1$ を含めば「2群の分散は等しいと言ってよさそう」、含まなければ「ばらつきに差がある」。§1のケース2（等分散プール $t$）を使ってよいかの目安にもなります。

4. 母比率の差 ─ 正規近似

2群の比率を比べる $p_1-p_2$ の推定です。各群の標本比率 $\hat{p}_1,\hat{p}_2$ の差を点推定値とし、標本サイズが十分大きければ正規近似（3-8 の1標本比率の2群版）が使えます。

FORMULA

$$(\hat{p}_1-\hat{p}_2)\ \pm\ z_{\alpha/2}\sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{n_1}+\frac{\hat{p}_2(1-\hat{p}_2)}{n_2}}$$ 標準誤差は、各群の比率の分散 $\dfrac{\hat{p}(1-\hat{p})}{n}$ を足して平方根を取った形です（2群が独立なら分散は足せる）。

区間推定では各群の $\hat{p}$ をそのまま標準誤差に使います（検定のときに出てくる「プールした比率」とは別なので混同しないでください)。正規近似が使えるのは、各群で「成功数も失敗数もおおむね $5$ 以上」が目安です。

5. 数値例

代表的なケースを実際に計算します。まずは母平均の差（等分散プール $t$）から。

EXAMPLE 1（母平均の差・等分散プール $t$）

A組 $n_1=10$ 人で平均 $\bar{X}_1=72$、不偏分散 $s_1^2=64$（$s_1=8$）。B組 $n_2=12$ 人で平均 $\bar{X}_2=66$、不偏分散 $s_2^2=100$（$s_2=10$）。等分散を仮定して $\mu_1-\mu_2$ の $95\%$ 信頼区間を求めます。

まずプールした分散を計算します。 $$s_p^2 = \frac{(10-1)\times 64 + (12-1)\times 100}{10+12-2} = \frac{576+1100}{20} = \frac{1676}{20} = 83.8$$ $$s_p = \sqrt{83.8}\approx 9.154$$ 自由度は $n_1+n_2-2=20$ なので $t_{0.025}(20)\approx 2.086$。標準誤差は $$s_p\sqrt{\frac{1}{10}+\frac{1}{12}} = 9.154\times\sqrt{0.1833} \approx 9.154\times 0.4282 \approx 3.920$$ 点推定値 $\bar{X}_1-\bar{X}_2 = 72-66 = 6$ を中心に、 $$6 \pm 2.086\times 3.920 = 6 \pm 8.18$$ よって $95\%$ 信頼区間は $\ -2.18 \le \mu_1-\mu_2 \le 14.18$。

区間が $0$ をまたいでいるので、「2組の平均に差があるとは言い切れない」と読めます。

EXAMPLE 2（母分散の比・$F$ 分布）

同じデータで、ばらつきに差があるかを $\dfrac{\sigma_1^2}{\sigma_2^2}$ の区間で確かめます。$\dfrac{s_1^2}{s_2^2}=\dfrac{64}{100}=0.64$。$F_{0.025}(9,11)\approx 3.588$、$F_{0.025}(11,9)\approx 3.912$ を使うと $$0.64\times\frac{1}{3.588} \ \le\ \frac{\sigma_1^2}{\sigma_2^2}\ \le\ 0.64\times 3.912$$ $$0.18 \ \le\ \frac{\sigma_1^2}{\sigma_2^2}\ \le\ 2.50$$

区間が $1$ を含むので、「2組の分散は等しいと見なしてよさそう」。EXAMPLE 1 で等分散を仮定したことが、ここで裏づけられました。

EXAMPLE 3（母比率の差・正規近似）

商品Pの認知度を2地域で調査。地域1は $n_1=220$ 人中 $132$ 人が「知っている」（$\hat{p}_1=0.6$）、地域2は $n_2=210$ 人中 $84$ 人（$\hat{p}_2=0.4$）。$p_1-p_2$ の $95\%$ 信頼区間は（$z_{0.025}=1.96$） $$\text{標準誤差} = \sqrt{\frac{0.6\times 0.4}{220}+\frac{0.4\times 0.6}{210}} \approx \sqrt{0.001091+0.001143} \approx \sqrt{0.002234}\approx 0.04726$$ $$(0.6-0.4) \pm 1.96\times 0.04726 = 0.2 \pm 0.093$$ よって $0.107 \le p_1-p_2 \le 0.293$。

区間が $0$ を含まないので、「地域1のほうが認知度が高いと言ってよさそう」と判断できます。

EXAMPLE 4（対応のある2標本）

$8$ 人の被験者について、トレーニング前後の記録の差 $D=\text{後}-\text{前}$ を測ったところ $$D:\ 3,\ 5,\ -1,\ 4,\ 2,\ 6,\ 0,\ 3$$ 平均は $\bar{D}=\dfrac{22}{8}=2.75$、不偏分散から $s_D\approx 2.375$。ペア数 $n=8$、自由度 $7$ で $t_{0.025}(7)\approx 2.365$。標準誤差は $\dfrac{s_D}{\sqrt{n}}=\dfrac{2.375}{\sqrt{8}}\approx 0.840$。 $$2.75 \pm 2.365\times 0.840 = 2.75 \pm 1.99$$ よって $0.76 \le \mu_D \le 4.74$。

区間が $0$ を含まないので、「トレーニングで記録が向上したと言ってよさそう」。同じデータを誤って独立2標本として扱うと標準誤差が大きくなり、この明確な差を見逃しかねません。対応はちゃんと活かすことが大切です。

6. 結論と使いどころ

公式はたくさんありますが、骨格はすべて「点推定値 $\pm$（$z$ または $t$）$\times$ 標準誤差」で共通です。

違うのは、(1) 標準誤差の中身、(2) $z/t/F$ のどれを引くか、(3) 自由度、の3点だけ。ここを表で押さえておけば、本番では状況判定 → 公式選択 → 代入、の流れ作業で解けます。

POINT

最後は区間が基準値を含むかで読み解きます。差（平均差・比率差）なら$0$ を含むか、比（分散比）なら$1$ を含むか。含めば「差があるとは言えない」、含まなければ「差があると言ってよさそう」。これは第4章で学ぶ仮説検定の結論と表裏一体で、区間推定はいわば「検定の答えを範囲で見せたもの」なのです。

これで第3章「統計的推定」はひと区切りです。次回 4-1 仮説検定の考え方からは第4章。「差があると言えるか」をイエス／ノーで判断する仮説検定に進みます。区間推定で身につけた標準誤差や $t/F$ の感覚が、そのまま検定統計量の理解につながりますよ。

さえ

公式の数に圧倒されないで！　「$\pm$ 係数 $\times$ 標準誤差」の形はぜんぶ一緒、変わるのは中身だけ。差なら $0$、比なら $1$ を含むかで読む──この合言葉だけ持って帰ってね。第3章おつかれさま、次はいよいよ検定だよ！

HANDWRITING — 紙に書いてインプットしよう！

このページに出てきた重要キーワードです。ページを閉じる前に、声に出しながら紙に手で書いてみてください。手を動かすと、読むだけの何倍も速く記憶に定着します。

母平均の差
標準誤差
等分散
プールした分散
Welch法
対応のある（対）データ
母分散の比
F分布
母比率の差
正規近似