STATS — 統計検定2級

統計検定2級 学習講座

統計検定2級の出題範囲を、「なぜその式になるのか」を導出から丁寧に解説する学習講座です。公式を暗記するのではなく、紙とペンで式変形を追いながら理解したい方へ。3級講座の続編として、記述統計から推定・検定・線形モデルまでをカバーします。

講師:榊 裕次郎(Excel講師・データサイエンティスト)
さえちゃん
さえ

3級講座でもナビゲートした、さえちゃんです! 2級は数式がぐっと増えるけど、この講座は途中式をぜんぶ見せるのがモットー。つまずきやすいポイントは私がフォローするよ! 右上のボタンでダークモードに切り替えできます。なお、コンテンツ内には広告が含まれています。あらかじめご了承くださいね。

CHAPTER 1

データの記述と要約

2級の土台となる記述統計の章です。変数の分類から始まり、分布・代表値・散らばり、相関と回帰直線、時系列まで。3級の復習をしつつ、共分散や相関係数を式できちんと計算できるところまで引き上げます。導出は軽め、定義と数値例を丁寧に押さえる構成です。

  1. 1 — 1

    変数の分類

    質的変数と量的変数、離散と連続、名義・順序・間隔・比の4つの尺度水準を整理します。

  2. 1 — 2

    量的データの分布

    度数分布表・ヒストグラム・幹葉図・累積度数、そして分布の形(対称・歪み・単峰多峰)の読み方を扱います。

  3. 1 — 3

    代表値(平均・中央値・最頻値)

    3つの代表値の意味と使い分け、外れ値への強さ、歪んだ分布での位置関係を整理します。

  4. 1 — 4

    散らばりの指標

    偏差・分散・標準偏差、範囲、四分位範囲、箱ひげ図まで。分散はn−1で割る不偏分散を基本に整理します。

  5. 1 — 5

    ローレンツ曲線とジニ係数

    所得などの不平等度を測るローレンツ曲線と、その面積から求めるジニ係数を数値例で計算します。

  6. 1 — 6

    標準化・変動係数・指数化

    標準化(zスコア)・偏差値、単位によらない変動係数、基準を100とする指数化を整理します。

  7. 1 — 7

    5数要約と外れ値

    最小・Q1・中央値・Q3・最大の5数要約、IQR、1.5×IQRによる外れ値判定と箱ひげ図の対応を扱います。

  8. 1 — 8

    質的データの要約

    度数・相対度数・度数分布表、棒グラフ・円グラフ・帯グラフの使い分けと注意点を整理します。

  9. 1 — 9

    散布図・相関係数・共分散

    散布図、共分散、−1〜1で関係の強さを表す相関係数の計算と読み方を、数値例で丁寧にたどります。

  10. 1 — 10

    相関の注意点

    擬似相関・交絡、相関と因果の違い、偏相関係数、相関行列、層別散布図の落とし穴を整理します。

  11. 1 — 11

    回帰直線

    最小二乗法の結論(傾き・切片の式)を押さえます。本格的な導出は第5章への伏線として残します。

  12. 1 — 12

    クロス集計表

    2つの質的変数の同時分布、周辺分布、条件付き分布(行・列の相対度数)から関連の有無を読みます。

  13. 1 — 13

    時系列データ①(成長率・幾何平均)

    変化率・成長率、指数化、そして複利の平均に効く幾何平均を、なぜ算術平均ではダメかから解説します。

  14. 1 — 14

    時系列データ②(トレンド・移動平均)

    トレンド・季節・不規則の変動成分、移動平均による平滑化、自己相関とコレログラムまで扱います。

CHAPTER 2

確率と確率分布

2級の導出の主戦場です。事象と確率、条件付き確率、ベイズの定理から、確率変数・期待値・分散、各種の確率分布、標本分布(χ²・t・F)、そして大数の法則・中心極限定理まで。期待値や分散の線形性を式でしっかり導き、暗記ではなく「なぜ成り立つか」を追います。

  1. 2 — 1

    事象と確率

    標本空間と事象、和・積・余事象と排反、確率の3公理、そして加法定理を整理します。

  2. 2 — 2

    条件付き確率と乗法定理

    条件付き確率P(A|B)、乗法定理、事象の独立、そして「独立」と「排反」の違いを押さえます。

  3. 2 — 3

    ベイズの定理

    全確率の定理とベイズの定理を導出し、病気検査の例で「結果から原因を推測する」確率を体感します。

  4. 2 — 4

    確率変数と確率分布

    離散・連続の確率変数、確率質量関数・確率密度関数、累積分布関数を整理します。

  5. 2 — 5a

    期待値(定義と線形性の導出)

    期待値の定義から、E[aX+b]やE[X+Y]の線形性を、独立性を仮定せずに導出します。

  6. 2 — 5b

    分散・標準偏差

    V[X]=E[X²]−(E[X])² と V[aX+b]=a²V[X] を、期待値の道具を使って導出します。

  7. 2 — 5c

    確率変数の和と差

    共分散、V[X±Y]の公式、そして「独立なら分散は和(差でも+)」という勘所を導きます。

  8. 2 — 6

    モーメント

    原点まわり・平均まわりのモーメント、そこから定まる歪度・尖度を整理します。

  9. 2 — 7

    離散分布①(ベルヌーイ・二項分布)

    二項分布をベルヌーイ試行の和とみて、期待値np・分散np(1−p)をきれいに導出します。

  10. 2 — 8

    離散分布②(ポアソン・幾何分布)

    稀な事象のポアソン分布、初成功までの幾何分布。pmfと期待値・分散、使いどころを整理します。

  11. 2 — 9

    連続分布①(一様・指数分布)

    一様分布と、待ち時間に現れる指数分布。pdf・期待値・分散と、指数分布の無記憶性を扱います。

  12. 2 — 10

    連続分布②(正規分布・標準正規分布)

    正規分布のpdf、標準化、68-95-99.7則、標準正規分布表の引き方まで整理します。

  13. 2 — 11

    2変量正規分布・共分散と相関

    相関係数ρの意味と、正規分布では「無相関=独立」が成り立つこと(一般との違い)を扱います。

  14. 2 — 12

    標本分布(χ²・t・F分布)

    統計量も確率変数という視点から、χ²・t・F分布の形と上側確率点の読み方を整理します。

  15. 2 — 13a

    チェビシェフの不等式

    分布の形によらず成り立つ、ばらつきの上限P(|X−μ|≥kσ)≤1/k²を導出します。

  16. 2 — 13b

    大数の法則

    標本平均の分散V[X̄]=σ²/nとチェビシェフから、標本平均が母平均に近づくことを示します。

  17. 2 — 13c

    中心極限定理

    母集団の分布によらず標本平均が正規分布に近づく、2級最重要の定理。二項分布の正規近似と連続修正まで。

CHAPTER 3

統計的推定

標本から母集団を推測する章です。母集団と標本、研究デザイン、標本抽出法を整理したうえで、点推定(不偏分散がなぜn−1で割るのか)と区間推定の論理(なぜ信頼区間が作れるのか)を導出から解説。さらに母平均・母分散・母比率・相関係数・2標本の各種信頼区間まで扱います。

  1. 3 — 1

    母集団と標本

    母数と統計量の区別、標本平均の分布、標準誤差SE=σ/√n。推定の舞台を整えます。

  2. 3 — 2

    研究デザイン(観察研究・実験研究)

    観察研究と実験研究の違い、交絡、ランダム化比較試験、フィッシャーの3原則を整理します。

  3. 3 — 3

    標本抽出法

    単純無作為・系統・層化・クラスター・多段抽出と、標本誤差・非標本誤差・バイアスを扱います。

  4. 3 — 4

    点推定(一致性・不偏性)

    推定量と推定値、不偏性・一致性・有効性。不偏分散がn−1で割る理由を導出します。

  5. 3 — 5

    区間推定の論理

    標本平均の分布からμを挟む区間を構成。信頼区間の正しい意味(よくある誤解と正解)も。

  6. 3 — 6

    母平均の区間推定(分散既知)

    正規母平均の信頼区間 X̄ ± z·σ/√n。信頼係数や標本サイズと区間幅の関係を扱います。

  7. 3 — 7

    母平均の区間推定(分散未知・t分布)

    分散未知のとき不偏分散とt分布を使う理由と、X̄ ± t·s/√n による区間を扱います。

  8. 3 — 8

    母分散・母比率の区間推定

    χ²分布を使う母分散の区間と、大標本の正規近似による母比率の区間を扱います。

  9. 3 — 9

    相関係数の区間推定

    フィッシャーのz変換で正規に近づけ、区間を作って逆変換で相関係数に戻す手順を扱います。

  10. 3 — 10

    2標本の区間推定

    母平均の差(等分散・不等分散・対応あり)、母分散の比、母比率の差の信頼区間を整理します。

CHAPTER 4

統計的仮説検定

データで仮説を検証する章です。帰無・対立仮説、有意水準、p値、第1種・第2種の誤りと検出力を整理し、「なぜその統計量で判断できるのか」という検定統計量の構成を導出。そのうえで1標本・2標本の各種検定(母平均・母分散・母比率)へ進みます。

  1. 4 — 1

    仮説検定の考え方

    帰無仮説と対立仮説、有意水準、p値の意味と検定の手順を、背理法に似た論理で押さえます。

  2. 4 — 2

    片側・両側検定と2種類の誤り

    棄却域、第1種・第2種の誤り、検出力1−β、そしてαとβのトレードオフを図で整理します。

  3. 4 — 3

    検定統計量の構成

    なぜその統計量で判断できるのか。帰無仮説のもとで既知分布に従う量の作り方を導出します。

  4. 4 — 4

    1標本:母平均のz検定・t検定

    分散既知のz検定、分散未知のt検定。棄却域とp値の2つのアプローチで判定します。

  5. 4 — 5

    1標本:母分散・母比率の検定

    χ²分布を使う母分散の検定と、正規近似による母比率の検定を扱います。

  6. 4 — 6

    2標本:母平均の差の検定

    分散既知・等分散プールt・不等分散Welch・対応ありの使い分けを判断フローで整理します。

  7. 4 — 7

    2標本:母分散の比・母比率の差の検定

    F検定による等分散性の検定と、プールした比率を使う母比率の差の検定を扱います。

CHAPTER 5

線形モデル分析

変数の関係を式でモデル化する章です。単回帰モデルを最小二乗法・正規方程式の導出から解説し、変動の分解・決定係数、回帰係数の検定、平均への回帰、重回帰(偏回帰係数・多重共線性・ダミー変数)、分散分析表の読み取り、そして1元・2元配置分散分析まで扱います。

  1. 5 — 1

    単回帰モデル(最小二乗法)

    残差平方和を最小化し、正規方程式から傾きと切片を導出。第1章の回帰直線の伏線を回収します。

  2. 5 — 2

    変動の分解・決定係数

    全変動=回帰変動+残差変動の分解、決定係数R²の意味、残差プロットの読み方を扱います。

  3. 5 — 3

    回帰係数の区間推定と検定

    回帰係数の標準誤差、傾きのt検定(H₀:β=0)と信頼区間。自由度がn−2になる理由も。

  4. 5 — 4

    平均への回帰

    |r|<1のとき予測が平均寄りになる仕組みと、それを実力と誤解する「回帰の誤謬」を扱います。

  5. 5 — 5

    重回帰モデル

    偏回帰係数の意味、多重共線性、ダミー変数によるカテゴリの取り込みを整理します。

  6. 5 — 6

    自由度調整済み決定係数・回帰の有意性の検定

    調整済みR²、回帰のF検定、そして分散分析表とソフト出力の読み取りを扱います。

  7. 5 — 7

    相関係数の検定

    母相関ρ=0の検定と、それが単回帰の傾きの検定と同値であることを扱います。

  8. 5 — 8

    1元配置分散分析

    3群以上の母平均をF比で一度に比較。群間変動・群内変動の分解と分散分析表を扱います。

  9. 5 — 9

    2元配置分散分析

    2つの要因の主効果と交互作用。平方和の分解と、交互作用のグラフによる読み取りを扱います。

CHAPTER 6

正規性・適合度・独立性のχ²検定

本編の最終章です。正規Q-Qプロットと歪度・尖度で分布の形(正規性)を確認したうえで、χ²分布を使う適合度の検定と独立性の検定を扱います。第1章のクロス集計表で見た「関連」を、統計的に判断できるようになります。

  1. 6 — 1

    正規Q-Qプロット

    標本分位数と理論分位数を対応させ、点が直線にのるかで正規性を視覚的に確認します。

  2. 6 — 2

    歪度・尖度

    分布の非対称性(歪度)と尖り具合(尖度)。正規分布を基準にした正規性の簡易チェックを扱います。

  3. 6 — 3

    適合度の検定

    観測度数が理論分布に従うかをχ²=Σ(O−E)²/Eで検定。サイコロの一様性などで扱います。

  4. 6 — 4

    独立性の検定

    分割表で2つの質的変数が独立かをχ²検定で判断。期待度数の作り方と自由度(r−1)(c−1)を扱います。

ADVANCED — 発展トラック

発展トラック

2級合格には必須でないものの、導出重視と最も相性が良い領域を独立配置しました。本編を終えた方が、任意で深掘りできる発展テーマです。

  1. 発展 1

    超幾何分布・多項分布・負の二項分布

    非復元抽出の超幾何、多カテゴリの多項、r回成功までの負の二項。二項分布との関係も整理します。

  2. 発展 2

    確率分布間の近似的関係

    二項→ポアソン→正規、超幾何→二項、t・χ²→正規。主要分布のつながりを関係図で俯瞰します。

  3. 発展 3

    検出力・検出力関数

    検出力を真のパラメータの関数として捉え、検出力曲線と必要標本サイズの設計を扱います。

  4. 発展 4

    ネイマン・ピアソンの基本定理

    最強力検定はどう作るか。尤度比検定が最強力になるという基本定理を直感的に解説します。

  5. 発展 5

    コクランの定理とその応用

    平方和がχ²に分解される定理。X̄とs²の独立性や分散分析の根拠を与えます。

  6. 発展 6

    多重比較(検定の多重性)

    検定を繰り返すと誤りが累積する問題と、ボンフェローニの不等式・補正による対処を扱います。

APPENDIX — 巻末資料

巻末資料

受験と実務の補助資料です。Rの「操作」は試験範囲外のため巻末に隔離し、統計ソフトの「出力の読み取り」は本編(5-6など)に残しています。

  1. 付録 A

    確率分布表の引き方

    標準正規・t・χ²・F分布表の読み方を、抜粋表と例題で。試験で配布される数値表の使い方です。

  2. 付録 B

    Rの使い方

    インストール・基本操作・データ読込・よく使う統計関数とコマンド例。lm()出力の読み取りは本編5-6と対応。

REFERENCES — 受験準備のために

統計検定2級について

実際の受験では、公式情報と公式書籍をぜひご活用ください。

試験概要

  • 試験形式:CBT方式(全国の試験会場のパソコンで受験)
  • 出題形式:4〜5肢選択問題
  • 問題数:35問程度
  • 試験時間:90分
  • 合格基準:100点満点中60点以上
  • 受験料:一般7,000円 / 学割5,000円(税込)
  • 電卓:普通電卓・事務用電卓のみ持込可(関数電卓は不可)。統計数値表は会場で配布

※最新情報は必ず公式サイトでご確認ください。受験料・実施方法は変更される場合があります。

公式サイト「統計検定2級」を見る
FEEDBACK — 質問・ご意見をお寄せください

わからない箇所、ありませんでしたか?

本講座を読み進める中で、「この導出が追えなかった」「もっと詳しく知りたい」という箇所がありましたら、ぜひお寄せください。可能な範囲でお返事いたします。いただいた質問は、本講座の改善や、新しい解説コンテンツの題材としても活用させていただきます。

質問・ご意見を送る

※Microsoft Formsで開きます。匿名で送信できます。