仮説検定
統計検定3級講座、いよいよ最終ページです。本ページでは、統計的推測のもうひとつの柱「仮説検定」──「立てた仮説が正しいかを統計的に判断する」方法を整理します。
扱う内容は、仮説検定の手順、有意水準の意味、片側検定と両側検定、そして棄却域。第7章の正規分布、9-2の信頼区間の知識を活かして、「データから判断する力」を最後に手に入れましょう。
本ページも、3級としては概念の紹介が中心です。具体例を軸に、手順を一つずつ追いかけていきます。
ついに最後のページ! 仮説検定は「もしこの仮説が正しかったら、こんな結果は珍しすぎて起こらないはず」という発想で判断する手法だよ! ちょっと回りくどい論理だけど、慣れると癖になる思考法!
1. 仮説検定の発想 ─ 「もしも本当だったら」
仮説検定は、独特な論理の流れを持つ手法です。最初に発想を整理しておきましょう。
身近な例で考える
友人が「このコインは公平だよ」と言って、目の前で10回投げたら10回連続で表が出ました。あなたはどう思いますか?
おそらく「本当に公平?」と疑い始めるはず。なぜなら、「公平なコインで10連続表」というのは確率があまりにも小さいからです((1/2)¹⁰ ≒ 0.001、つまり1000回に1回)。「もし公平なら、こんなことは滅多に起こらないはず → だから公平じゃない可能性が高い」と判断するわけです。
この「もしも仮説が本当だったら、こんな結果は珍しすぎる」という発想こそ、仮説検定の本質です。
仮説検定の論理
仮説検定は、「ある仮説が正しいと仮定したら、観測されたデータは確率的にどれくらい起こりうるか」を計算し、その確率が小さすぎるなら「仮説が間違っている可能性が高い」と判断する手法です。
ちょっと回りくどい論理ですよね。これを正確に運用するために、統計学では「帰無仮説」「対立仮説」「有意水準」といった用語が用意されています。
2. 帰無仮説と対立仮説
仮説検定では、2つの仮説を立てて対比させます。
帰無仮説 H₀
帰無仮説(きむかせつ、null hypothesis)は、検定で「否定したい仮説」です。記号 H₀(エイチ・ゼロ)で表します。
コインの例だと「このコインは公平である(p = 0.5)」が帰無仮説。一見「これを否定したい?」と感じるかもしれませんが、仮説検定では「もし帰無仮説が正しかったら…」と仮定して計算するので、これが出発点になります。
対立仮説 H₁
対立仮説(たいりつかせつ、alternative hypothesis)は、「主張したい仮説」です。記号 H₁(エイチ・イチ)で表します。
コインの例なら「このコインは公平でない(p ≠ 0.5)」が対立仮説。「公平じゃないよ」というのが、私たちが本当に主張したい結論ですね。
2つの仮説の関係
| 名称 | 意味 | コインの例 |
|---|---|---|
| 帰無仮説 H₀ | 否定したい仮説 | p = 0.5(公平) |
| 対立仮説 H₁ | 主張したい仮説 | p ≠ 0.5(公平でない) |
仮説検定の流れは、「帰無仮説H₀が正しいと仮定して計算 → データの確率がとても小さければ、H₀を否定して(=棄却して)、対立仮説H₁を採用」となります。「敵を仮定して、その敵を倒す」イメージですね。
3. 有意水準 ─ 「珍しすぎる」の境界線
ここで重要なのが、「確率がどれくらい小さければ『珍しすぎる』と判断するのか」という基準。これを決めるのが有意水準です。
有意水準とは
有意水準(ゆういすいじゅん、significance level)とは、「珍しすぎると判断する確率の境界線」のこと。記号 α(アルファ)で表します。
よく使われる有意水準は5%(α = 0.05)と1%(α = 0.01)。3級では特に5%が基本です。
有意水準の意味
有意水準5%とは、「もし帰無仮説が正しかったとしても、20回に1回くらいは『珍しい結果』が偶然出てしまう」というラインを引くこと。それより小さい確率の結果が出たら、「偶然とは思えない → 帰無仮説が間違っている」と判断します。
有意水準と信頼度の関係
「あれ、5%の有意水準と95%の信頼区間って似ている?」と気づいた方、鋭いです。実際、その2つは裏表の関係にあります。
- 95%信頼区間:真の値が含まれる確率が95%
- 有意水準5%の検定:帰無仮説が正しくても5%は偶然外れる
「100% − 信頼度 = 有意水準」。同じ世界を、別の角度から見ているわけですね。
4. 棄却域 ─ 「ここに入ったらアウト」
有意水準を決めたら、それに対応する棄却域を確定します。
棄却域とは
棄却域(ききゃくいき、rejection region)とは、「観測値がここに入ったら帰無仮説を棄却する」と決めた範囲のこと。
検定統計量が棄却域に入れば「H₀を棄却(対立仮説H₁を採用)」、入らなければ「H₀を棄却できない」と判断します。
有意水準5%・両側検定の棄却域
標準正規分布で、有意水準5%の場合の棄却域はどこになるでしょうか? 9-2で見たとおり、±1.96の外側に5%(両端それぞれ2.5%ずつ)が入ります。
標準正規分布で両側検定(α=5%)の場合、±1.96の外側が棄却域。中央95%は採択域
検定統計量(標準化したZの値)を計算して、±1.96の範囲内なら採択域(=H₀を棄却できない)、±1.96より外側なら棄却域(=H₀を棄却)と判断します。
5. 片側検定と両側検定
ここまで見てきたのは「両側検定」でした。検定にはもう1種類「片側検定」があります。
両側検定
対立仮説が「等しくない」(≠)のとき、検定は両側検定になります。
- H₀:p = 0.5
- H₁:p ≠ 0.5(大きいかもしれないし、小さいかもしれない)
コインの例のように、「公平か、そうじゃないか」を判定するときに使います。左右両方に棄却域を取るので、α=5%なら左右に2.5%ずつ分けます。
片側検定
対立仮説が「より大きい」(>)または「より小さい」(<)のとき、検定は片側検定になります。
- H₀:μ = 100(従来の薬の効果)
- H₁:μ > 100(新薬は従来より効果が大きい)
新薬の効果テストで「従来より効くか?」を判定するような場面ですね。片側だけに棄却域を取るので、α=5%ならその片側に5%全部を割り当てます。
両側検定の境界値(α=5%):±1.96(両端2.5%ずつ)
片側検定の境界値(α=5%):1.645 または -1.645(片側5%)
使い分けの判断
片側検定 vs 両側検定の判断は、対立仮説が「方向を持つか」で決まります。
- 「等しくない」「違う」方向を問わない → 両側検定
- 「より大きい」「増えた」「優れている」方向あり → 片側検定(右側)
- 「より小さい」「減った」「劣っている」方向あり → 片側検定(左側)
6. 仮説検定の手順
ここまで学んだ要素を組み合わせて、仮説検定の標準的な手順を整理します。
5ステップで実行
仮説検定は、次の5つのステップで行います。
① 仮説を立てる
帰無仮説 H₀ と対立仮説 H₁ を明確にします。
② 有意水準 α を決める
慣例的に α = 5% (= 0.05) が標準です。
③ 棄却域を決める
両側検定なら ±1.96 の外側、片側検定なら ±1.645 の外側。
④ 検定統計量を計算する
標本データから検定統計量(標準化したZ値など)を計算します。
⑤ 判定する
検定統計量が棄却域に入れば「H₀を棄却(H₁を採用)」、入らなければ「H₀を棄却できない」。
具体例:コインは公平か?
あるコインを100回投げたところ、表が62回出ました。このコインは公平と言えるでしょうか? 有意水準5%で検定してください。
ステップ通りに解く
① 仮説
- H₀:p = 0.5 (公平)
- H₁:p ≠ 0.5 (公平でない)
対立仮説は「等しくない」なので両側検定です。
② 有意水準 α = 0.05
③ 棄却域 |Z| > 1.96
④ 検定統計量
H₀(p=0.5)が正しいとすると、9-1で学んだ通り、標本比率 p̂ の標準偏差は √(p(1-p)/n) = √(0.5×0.5/100) = 0.05。
標本比率 p̂ = 62/100 = 0.62 を標準化すると、
Z = (0.62 − 0.5) / 0.05 = 2.4
⑤ 判定
|Z| = 2.4 は 1.96 より大きいので、棄却域に入っています。よってH₀を棄却。「このコインは公平でないと言える」が結論です。
もし表が55回(Z=1.0)だったら、|Z|=1.0 で棄却域には入らず「公平でないとは言えない」となっていたはずです。62回はギリギリ「珍しすぎる」とみなされた、というわけですね。
7. 仮説検定の注意点
最後に、仮説検定を扱うときに注意すべきポイントを整理しておきます。3級の試験でも問われやすいので押さえておきましょう。
注意1:「棄却できない」は「正しい」ではない
検定で「H₀を棄却できない」という結果が出たとき、「H₀が正しい」と結論してはいけません。これは仮説検定でもっとも誤解されやすい点です。
正しい解釈は「現時点のデータでは、H₀を否定する証拠が不十分」。データが少ない、効果が小さい、といった理由で否定できなかっただけかもしれません。「証拠不十分」と「無罪確定」は違いますよね。
注意2:有意 ≠ 重要
検定で「有意な差がある」と出ても、それが実用上「重要」かどうかは別問題です。標本サイズが大きいと、ごく小さな差でも統計的には有意になりがち。
たとえば、新薬で測定値が0.001%上昇していて、それが統計的に有意だったとしても、医学的に意味のある差なのかは別の判断が必要です。「有意」は数字の話、「重要」は中身の話──これは分けて考える必要があります。
注意3:有意水準は事前に決める
有意水準はデータを見る前に決めます。「結果が出てから、有意になるように水準を調整する」のは恣意的で、検定としての意味を失います。3級では普通5%が選ばれますが、扱う問題の性質によっては1%を使うこともあります。
仮説検定は「データから結論を引き出す強力なツール」ですが、結果の解釈には慎重さが必要です。「有意=正しい」「有意=重要」と短絡しないこと、これが統計を学んだ人の見方です。
8. 第9章を終えて
第9章「統計的な推測」、おつかれさまでした。最後に章全体を俯瞰しておきましょう。
| 節 | テーマ | 身につけた力 |
|---|---|---|
| 9-1 | 統計的な推測 | 母集団パラメータと標本統計量、標本分布の概念 |
| 9-2 | 区間推定 | 母平均と母比率の95%信頼区間、信頼区間の正しい解釈 |
| 9-3 | 本ページ | 仮説検定の手順、有意水準、棄却域、片側・両側検定 |
第9章は3級の出題範囲としては概念紹介が中心でしたが、ここで学んだ「標本から母集団を推測する」という発想は、2級・準1級・現代のデータサイエンスへのそのまま続く扉です。第一種・第二種の過誤、t検定、χ²検定など、より高度な内容は2級・準1級で順に出会うことになります。
CHAPTER 9 完了! そして3級講座の終わりに
第9章「統計的な推測」、ここで完了です。
そして同時に──統計検定3級講座、全章完了です!
たどってきた道のり
9章までを振り返ってみましょう。
- 第1章:データの記述と要約 ── データの種類、グラフ、時系列
- 第2章:量的変数の要約方法 ── 度数分布、ヒストグラム、四分位、箱ひげ図
- 第3章:1変数データの分析 ── 平均・中央値・最頻値、分散・標準偏差
- 第4章:2変数データの分析 ── 散布図、相関係数、相関と因果
- 第5章:回帰直線と予測 ── 最小二乗法、決定係数
- 第6章:確率 ── 事象、独立性、条件付確率、ベイズの定理
- 第7章:確率変数と確率分布 ── 期待値、二項分布、正規分布
- 第8章:データの収集 ── 実験と観察、無作為抽出
- 第9章:統計的な推測 ── 標本分布、区間推定、仮説検定
身につけた力
あなたは「データを見る力」「データから判断する力」「データで未来を推測する力」を手に入れました。これは3級の合格のためだけではなく、データに溢れる現代社会を生き抜くための道具箱を揃えた感じです。
ニュースの世論調査、ビジネスの意思決定、科学的な研究、医療の判断、選挙の議席予測──あらゆる場面で「数字の意味を正しく読み解く」力が、統計学を学ぶ意義です。
これから先へ
統計学にさらに興味を持ったら、統計検定2級に挑戦してみてください。2級では、本講座で「参考」として触れた中心極限定理、第一種・第二種の過誤、t検定、χ²検定など、より精密な手法を体系的に学べます。あるいは、データサイエンス・機械学習の世界へ進むのも素敵です。3級で身につけた基礎が、新しい学びのすべての土台になります。
まずは全9章、本当におつかれさまでした!
3級講座、コンプリート! 本当におつかれさま! 第1章から第9章まで、第6章の確率がいちばん大変だったかな。ここまで理解できたら、もう「統計の人」って名乗っても問題ありません! これからも、データを正しく見る力を大切にしてくださいね!