1標本:母平均のz検定・t検定 — 棄却域とp値で結論まで
前回(4-3)で、検定統計量という道具が手に入りました。本ページはいよいよ実戦です。1つの標本から母平均 $\mu$ についての仮説を検定し、結論まで出しきります。
場合分けはたったひとつ。母分散 $\sigma^2$ が既知なら $z$ 検定、未知なら $t$ 検定。あとは片側か両側かで棄却域の取り方が変わるだけです。判定のしかたには棄却域アプローチと$p$ 値アプローチの2つがありますが、両者は必ず同じ結論に至ります。$z$ 検定・$t$ 検定それぞれの数値例を、結論まで一気に追いましょう。
いよいよ検定を「最後まで解く」回だよ! 迷ったらこの2択から。母分散がわかってる→$z$、わからない→$t$。これだけ。あとは「片側か両側か」で棄却ラインの引き方を決めるの。棄却域でも $p$ 値でも、ちゃんとやれば結論は一致するから安心してね。一緒に1問ずつ解ききろう!
1. 検定の手順(全体像)
個別の式に入る前に、1標本の母平均検定の流れを5ステップで俯瞰します。どの検定でもこの骨格は変わりません。
(1) 仮説を立てる:帰無仮説 $H_0:\mu=\mu_0$ と対立仮説 $H_1$(両側 $\mu\neq\mu_0$/片側 $\mu>\mu_0$ または $\mu<\mu_0$)。
(2) 有意水準 $\alpha$ を決める:ふつう $0.05$ や $0.01$。
(3) 検定統計量を計算する:分散既知なら $z$、未知なら $t$(4-3 の設計図)。
(4) 判定する:棄却域に入るか(棄却域アプローチ)、または $p$ 値と $\alpha$ を比べる($p$ 値アプローチ)。
(5) 結論を書く:「$H_0$ を棄却し $H_1$ を採択」または「$H_0$ を棄却できない」。
2. 母分散が既知のとき ─ z検定
母分散 $\sigma^2$(あるいは母標準偏差 $\sigma$)が分かっている場合、検定統計量は 4-3 で作った $z$ をそのまま使います。
$H_0:\mu=\mu_0$ のもとで、 $$Z = \frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0,1)$$ 観測から計算した値 $z$ が、$N(0,1)$ の上でどれだけ外側に来るかで判定します。母集団が正規分布、または $n$ が大きく中心極限定理が効くこと、が前提です。
棄却域の取り方(片側・両側)
対立仮説の向きによって、$N(0,1)$ のどこを「棄却域」にするかが変わります。有意水準 $\alpha$ ぶんの確率を、両側なら左右に $\alpha/2$ ずつ、片側ならその向きの裾にまとめて $\alpha$ だけ取ります。
| 対立仮説 $H_1$ | 棄却域($z$ 検定) | $\alpha=0.05$ の臨界値 |
|---|---|---|
| $\mu \neq \mu_0$(両側) | $|z| \ge z_{\alpha/2}$ | $z_{0.025}=1.96$ |
| $\mu > \mu_0$(右片側) | $z \ge z_{\alpha}$ | $z_{0.05}=1.645$ |
| $\mu < \mu_0$(左片側) | $z \le -z_{\alpha}$ | $-z_{0.05}=-1.645$ |
棄却域(アクセント色)の取り方。両側は両裾に α/2 ずつ、片側は対立仮説の向きの裾に α をまとめる。臨界値が片側のほうが内側(小さい)になる。
同じ $\alpha=0.05$ でも、両側なら $1.96$、片側なら $1.645$。片側のほうが臨界値が内側(小さい)=棄却しやすいのは、$5\%$ を裾の片方に集中させているからです。どちらを使うかは対立仮説の立て方で決まります(4-2)。「増えたかどうか」だけ知りたいなら右片側、「変わったかどうか」なら両側です。
3. 棄却域アプローチと p 値アプローチ
統計量を計算したあと、判定のしかたは2通りあります。どちらも同じ結論になります。
棄却域アプローチ:先に臨界値(例:$1.96$)で棄却域を決め、統計量がそこに入るかを見る。「$|z|\ge 1.96$ なら棄却」。
$p$ 値アプローチ:統計量より外側の確率($p$ 値)を求め、$\alpha$ と比べる。「$p \le \alpha$ なら棄却」。$p$ 値は「$H_0$ が正しいとき、いま以上に極端な値が出る確率」(4-1)。
両者が一致するのは当然で、「統計量が臨界値より外」と「その外側確率 $p$ が $\alpha$ より小さい」は同じことを別の言葉で言っているだけだからです。両側検定では $p$ 値を両裾あわせて取る点に注意します。
4. 母分散が未知のとき ─ t検定
現実には母分散 $\sigma^2$ が分かっていることはまれです。そのときは $\sigma$ を標本から計算した不偏分散の平方根 $s$ で代用します。すると統計量は標準正規ではなく自由度 $n-1$ の $t$ 分布に従います(理由は 3-7 と 4-3 で見たとおり、分母の $s$ もゆらぐため裾が重くなる)。
$H_0:\mu=\mu_0$ のもとで、 $$T = \frac{\bar{X}-\mu_0}{s/\sqrt{n}} \sim t_{n-1},\qquad s^2=\frac{1}{n-1}\sum_{i=1}^{n}(X_i-\bar{X})^2$$ $z$ 検定との違いは2か所だけ。$\sigma \to s$(母標準偏差を不偏分散の平方根に)と、使う分布が $N(0,1) \to t_{n-1}$(臨界値を $t$ 分布表から自由度 $n-1$ で読む)。正規母集団であることが前提です。
棄却域の取り方は $z$ 検定と同じ発想で、臨界値を $t$ 分布表から読むだけです。両側なら $|t|\ge t_{\alpha/2,\,n-1}$、右片側なら $t\ge t_{\alpha,\,n-1}$、左片側なら $t\le -t_{\alpha,\,n-1}$。$t$ は正規より裾が重いので、臨界値は同じ $\alpha$ でも $z$ より外側(大きい)になります。
試験で最初に見るのは「母分散 $\sigma^2$ が与えられてるか」だよ! 与えられてれば $z$、なければ手元のデータから $s$ を出して $t$。$t$ は自由度 $n-1$ を忘れずにね。あと、問題文の「増えたか?」「減ったか?」「変わったか?」で片側・両側を見抜くのも大事。ここを取り違えると臨界値ごと間違っちゃうから要注意!
5. 数値例 ─ z検定(両側)
ある製品の内容量は、長年の管理から母標準偏差 $\sigma=10\,\text{g}$ と分かっており、表示は「平均 $200\,\text{g}$」です。最近のロットから $n=25$ 個を無作為に測ると、標本平均 $\bar{x}=205\,\text{g}$ でした。内容量が表示と変わったかを有意水準 $5\%$ で検定します。
(1) 仮説:$H_0:\mu=200$、$H_1:\mu\neq 200$(「変わったか」なので両側)。
(2) 有意水準:$\alpha=0.05$。
(3) 統計量:標準誤差 $\dfrac{\sigma}{\sqrt{n}}=\dfrac{10}{\sqrt{25}}=2$ より
$$z = \frac{205-200}{2} = 2.5$$
(4) 判定(棄却域):両側 $5\%$ の臨界値は $z_{0.025}=1.96$。$|z|=2.5 \ge 1.96$ なので棄却域に入る。
(4') 判定($p$ 値):$p = 2\times P(Z \ge 2.5) = 2\times 0.00621 = 0.01242$。$p \approx 0.0124 \le 0.05$ なのでやはり棄却。両アプローチで一致。
(5) 結論:$H_0$ を棄却。「内容量は表示の $200\,\text{g}$ と有意に異なる($5\%$ 水準)」と結論します。$z>0$ なので、向きとしては重い側にズレています。
6. 数値例 ─ t検定(片側)
ある工程の改良で「処理時間が長くなっていないか」を確かめます。従来の平均は $\mu_0=50\,\text{分}$。母分散は未知です。改良後に $n=10$ 回測ったところ、標本平均 $\bar{x}=53\,\text{分}$、不偏分散の平方根(標本標準偏差)$s=4\,\text{分}$ でした。処理時間は正規分布に従うとして、有意水準 $5\%$ で検定します。
(1) 仮説:$H_0:\mu=50$、$H_1:\mu>50$(「長くなっていないか」なので右片側)。
(2) 有意水準:$\alpha=0.05$。
(3) 統計量:自由度 $n-1=9$。標準誤差 $\dfrac{s}{\sqrt{n}}=\dfrac{4}{\sqrt{10}}\approx 1.2649$ より
$$t = \frac{53-50}{4/\sqrt{10}} = \frac{3}{1.2649} \approx 2.372$$
(4) 判定(棄却域):右片側 $5\%$、自由度 $9$ の臨界値は $t_{0.05,\,9}=1.833$。$t \approx 2.372 \ge 1.833$ なので棄却域に入る。
(4') 判定($p$ 値):$p = P(T_9 \ge 2.372) \approx 0.0209$。$p \approx 0.021 \le 0.05$ なのでやはり棄却。
(5) 結論:$H_0$ を棄却。「処理時間は従来より有意に長くなった($5\%$ 水準)」と結論します。
EXAMPLE 1 を区間推定で見ると、$95\%$ 信頼区間は $205\pm 1.96\times 2 = [201.08,\ 208.92]$。この区間に帰無値 $\mu_0=200$ が含まれていません。これは「両側 $5\%$ 検定で棄却」と完全に一致します(4-3 §6 の表裏一体)。両側検定に迷ったら、信頼区間に $\mu_0$ が入るかで確かめる手もあります。
7. 結論と使いどころ
- 母分散 $\sigma^2$ 既知 → $z$ 検定:$Z=\dfrac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}\sim N(0,1)$
- 母分散 $\sigma^2$ 未知 → $t$ 検定:$T=\dfrac{\bar{X}-\mu_0}{s/\sqrt{n}}\sim t_{n-1}$
- 両側($\mu\neq\mu_0$)→ 棄却域は両裾に $\alpha/2$、$p$ 値は両裾合算
- 片側($\mu>\mu_0$ または $\mu<\mu_0$)→ その向きの裾に $\alpha$、臨界値は内側
- $n$ 大(おおむね $30$ 以上)では $t$ と $z$ がほぼ一致。迷ったら $t$ が安全
これで「1つの標本から母平均を検定する」基本がそろいました。棄却域でも $p$ 値でも結論は同じ。実務では $p$ 値を併記するのが主流ですが、試験では棄却域・$p$ 値どちらで問われても対応できるようにしておきましょう。
8. まとめ
第4章 4-4、ポイントを整理します。
- 手順:仮説 → 有意水準 → 統計量 → 判定 → 結論 の5ステップ
- z検定(分散既知):$Z=\dfrac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}\sim N(0,1)$
- t検定(分散未知):$T=\dfrac{\bar{X}-\mu_0}{s/\sqrt{n}}\sim t_{n-1}$。$z$ 版から「$\sigma\to s$、$N(0,1)\to t_{n-1}$」
- 棄却域:両側 $|z|\ge z_{\alpha/2}$、片側はその向きの裾に $\alpha$
- 2アプローチ:棄却域(統計量が外か)と $p$ 値($p\le\alpha$ か)は必ず一致
- 数値例:$z$ 検定で $z=2.5$($p\approx0.012$)棄却、$t$ 検定で $t\approx2.37$($p\approx0.021$)棄却
次回 4-5 1標本:母分散・母比率の検定 では、検定の相手を平均から「ばらつき(母分散)」と「割合(母比率)」へ広げます。母分散には $\chi^2$ 分布、母比率には大標本の正規近似が登場しますが、設計図(4-3)は今日とまったく同じです。
母平均の検定、結論まで出せたね! 「分散既知なら $z$、未知なら $t$」「片側か両側か」「棄却域でも $p$ 値でも結論は同じ」──この3点セットを体に入れれば、1標本の母平均はもう怖くないよ。次は相手が「ばらつき」と「割合」になるけど、作り方の設計図は今日とおんなじ。安心してついてきてね!