第3章 3-3 / 統計的推定

標本抽出法 — 5つの抽出法と標本誤差・バイアス

このページで学ぶこと

3-1 で「標本から母集団を推定する」枠組みを、3-2 で「どう割り当てるか」を学びました。今回は残るもう一つの肝、「どう選ぶか」──標本抽出法です。

単純無作為抽出を出発点に、系統抽出・層化抽出・クラスター(集落)抽出・多段抽出の5つを、仕組みと長所短所の表で一気に整理します。さらに、推定にどうしてもつきまとう誤差を標本誤差非標本誤差に分け、選択バイアス・無回答バイアスという「サンプル数では消えない厄介者」までしっかり押さえます。

さえちゃん
さえ

標本の選び方って「全員から平等にくじ引き」だけじゃないんだよ。現場ではリストが手に入らなかったり、コストが厳しかったり…。だから状況に合わせて5種類の抽出法を使い分けるの。今日はそれぞれの“クセ”を、図で見ながらつかんでいこう!

1. なぜ「無作為に選ぶ」のか

抽出法の話に入る前に、土台となる発想を確認します。無作為抽出(むさくいちゅうしゅつ、random sampling)とは、人間の意図やパターンを介さず、機械的(乱数・くじ引き)に標本を選ぶこと。なぜこれが大事なのでしょうか。

理由は2つあります。ひとつは、3-2 でも見たとおりバイアス(偏り)を避けられること。母集団のすべての要素に「選ばれる平等な機会」を与えれば、特定の層だけが標本に入る事故を防げます。

もうひとつ、2級で重要なのが標本誤差を数学的に扱えるようになること。無作為に選んだ標本なら、$\bar{X}$ の分布が 3-1 の $\bar{X}\approx N\!\left(\mu,\dfrac{\sigma^2}{n}\right)$ に従い、標準誤差 $\mathrm{SE}=\dfrac{\sigma}{\sqrt{n}}$ で誤差を見積もれます。「ランダムだから確率で語れる」──これが推測統計の前提です。

POINT

無作為抽出は、バイアスを避けるためと、標本誤差を確率で見積もれるようにするための土台です。以降の5つの抽出法は、いずれも「どこかの段階で無作為を使う」ことで、この土台を保ちながら現場の制約に対応する工夫だと考えてください。

2. 5つの抽出法 — 仕組みと模式図

① 単純無作為抽出(simple random sampling)

母集団の全員に番号を振り、乱数で必要数を選ぶ方法。全員が等確率で選ばれる、いちばん基本的でクリーンなやり方です。理論との相性が抜群で、標準誤差の式もそのまま使えます。弱点は、母集団全員のリスト(名簿)が必要なこと。大規模だとリスト作成も抽出も大変です。

② 系統抽出(systematic sampling)

最初の1個だけ無作為に選び、あとは一定間隔で機械的に選ぶ方法(等間隔抽出)。$N$ 人から $n$ 人選ぶなら、抽出間隔は $k=N/n$。1〜$k$ から出発点をランダムに決め、$k$ おきに拾います。実施が簡単な反面、リストに周期性があると、その周期と $k$ が噛み合って偏る危険があります。

系統抽出(k=4, 出発点=2)

系統抽出:出発点2を無作為に決め、4つおきに選ぶ(色付きが標本)

③ 層化抽出(stratified sampling)

母集団を性質の似たグループ(層)に分け、各層から無作為抽出する方法。年代・地域・性別などで層を作り、人口比に応じて各層から取れば、少数派の声も確実に拾え、推定の精度(ばらつき)も上がりやすいのが強みです。各層の内部が似ていて、層どうしの違いが大きいときほど効果的。手間は、層分けのための情報が必要なこと。

層化抽出(各層から無作為に) 層A(若年) 層B(中年) 層C(高年)

層化抽出:母集団を層に分け、各層の中から無作為に選ぶ(色付きが標本)

④ クラスター(集落)抽出(cluster sampling)

母集団を小さな集まり(クラスター・集落)に分け、いくつかの集落を無作為に選び、選んだ集落は丸ごと全員調べる方法。たとえば市内の小学校から5校を選び、その5校の全児童を調査する、というイメージ。実地調査の範囲を絞れるのでコスト・時間を大きく節約できます。弱点は、同じ集落内は似た人が集まりがちで無作為性が下がり、標本誤差が大きくなりやすいこと。

クラスター抽出(選んだ集落は全員)

クラスター抽出:集落を無作為に選び、選ばれた集落は全員を調べる(色付き)

⑤ 多段抽出(multistage sampling)

大きな単位から小さな単位へ、段階を踏んで無作為抽出を繰り返す方法。たとえば「全国の市区町村から100か所→各市区町村から数校→各校から1クラス」のように絞り込みます。母集団全員のリストがなくても、各段階のリストさえあれば調査できるのが最大の利点。全国規模の調査でよく使われます。段階が増えるほど誤差は積み上がりやすくなります。

クラスター抽出は「選んだ集落を全員」、多段抽出は「選んだ集落の中をさらに無作為抽出」という違いがあります。多段抽出は、層化・クラスターを組み合わせて使うことも多いです。

さえちゃん
さえ

層化とクラスター、名前は似てるけど真逆の発想だよ! 層化は「各層“から少しずつ”取る」=層の中の違いを大事にする。クラスターは「いくつかの集落を“丸ごと”取る」=集落間で代表させる。図の色のつき方を見比べると一発でわかるよ!

3. 5つの抽出法の長所・短所

抽出法 仕組み 長所 短所
単純無作為抽出 全員から等確率で選ぶ 理論上もっとも公平・誤差計算が素直 全員の名簿が必要・大規模だと手間
系統抽出 一定間隔で機械的に選ぶ 実施が簡単・リスト全体に均等に散る リストの周期性で偏ることがある
層化抽出 層に分け各層から無作為 少数派も代表・精度が上がりやすい 層分けの情報が必要
クラスター抽出 集落を選び丸ごと調べる コスト・時間を大きく節約 無作為性が下がり誤差が大きくなりやすい
多段抽出 段階的に絞り込む 全員名簿が不要・広域調査に強い 段階が増えるほど誤差が積み上がる
POINT

試験では「この説明はどの抽出法か」を問う問題が定番です。判別のコツは、無作為をどこで使うか選んだ単位を全部調べるか/さらに絞るかの2点。系統=等間隔、層化=各層から少し、クラスター=集落を丸ごと、多段=段階的に絞る、と紐づけて覚えましょう。

4. 標本誤差と非標本誤差

どんなに上手に抽出しても、標本調査には誤差がつきものです。誤差は性質の違う2種類に分かれます。

標本誤差(sampling error)

標本誤差は、「全部ではなく一部しか調べていない」ことから必然的に生じる誤差です。標本を取り直すたびに $\bar{X}$ は少しずつ変わる──そのばらつきそのもの。これは 3-1 の標準誤差 $\mathrm{SE}=\dfrac{\sigma}{\sqrt{n}}$ で大きさを見積もれます。重要なのは、サンプルサイズ $n$ を増やせば小さくできること。$\sqrt{n}$ に反比例して縮みます。

非標本誤差(non-sampling error)

非標本誤差は、抽出そのものとは別に、調査の運用や答え方から生じる誤差です。無回答、測定ミス、入力ミス、名簿の漏れ、回答者の本心でない回答など。やっかいなのは、サンプルを増やしても消えない(むしろ悪化することもある)点です。

観点 標本誤差 非標本誤差
原因一部しか調べていないため調査の運用・回答の仕方
$n$ を増やすと小さくなる($\propto 1/\sqrt{n}$)変わらない/悪化することも
見積もり標準誤差で計算できる計算で予測しにくい
対策サンプルサイズの確保調査設計・運用の改善
POINT

標本誤差は「$n$ を増やせば縮む、見積もれる誤差」。非標本誤差は「$n$ では消えない、隠れた誤差」。標本調査でいちばん怖いのは、実は非標本誤差のほうです。次に見るバイアスは、この非標本誤差の代表選手です。

5. バイアス — 選択バイアスと無回答バイアス

バイアス(bias、偏り)とは、標本が母集団を偏った形で代表してしまうこと。非標本誤差の中でもとくに警戒すべき存在で、サンプル数をいくら増やしても解決しません。代表的な2つを押さえましょう。

選択バイアス(selection bias)

標本の選び方そのものが偏っていることから生じます。有名なのが1936年のアメリカ大統領選の予測失敗。ある雑誌は237万人もの大規模調査をしたのに、結果を大きく外しました。原因は、名簿を電話帳と自動車登録から作ったこと。当時それらを持つのは裕福な層に偏っており、経済的に苦しい層の声がほとんど標本に入らなかったのです。「数が多くても、選び方が偏れば外れる」という統計学の教訓です。

無回答バイアス(non-response bias)

回答してくれた人と、してくれなかった人で性質が違うことから生じます。たとえば満足度調査で、強い不満を持つ人だけが熱心に回答すると、結果は実態より悪く出ます。無回答が多いほど、この偏りのリスクは高まります。3-1 で触れた国勢調査の未回収率上昇も、全数調査ですら無回答の影響と無縁でないことを示しています。

バイアスへの対策

POINT

バイアスはサンプル数では解決しない。237万人でも外れたのが何よりの証拠です。「どれだけ集めるか」より「どう選ぶか・どう回収するか」が効く。これが標本調査の鉄則であり、無作為抽出を重んじる最大の理由です。

さえちゃん
さえ

「標本誤差はサンプル増やせば縮む、バイアスは縮まない」──ここ、ほんとに頻出! 標準誤差の $\dfrac{\sigma}{\sqrt{n}}$ は $n$ で小さくできるけど、選び方の偏りは $n$ をどれだけ増やしても残るの。量より質、覚えておこう!

6. 結論と使いどころ

EXAMPLE 1(系統抽出の間隔)

会員 $1{,}200$ 人から $80$ 人を系統抽出します。抽出間隔 $k$ は?

$k = \dfrac{N}{n} = \dfrac{1200}{80} = 15$。$1\sim 15$ から出発点をランダムに選び、$15$ おきに拾えば $80$ 人になります。

EXAMPLE 2(層化抽出の比例配分)

母集団が若年 $30\%$・中年 $50\%$・高年 $20\%$ で、合計 $1{,}000$ 人を層化抽出(比例配分)します。各層から何人?

若年 $1000\times 0.3 = 300$ 人、中年 $1000\times 0.5 = 500$ 人、高年 $1000\times 0.2 = 200$ 人。人口比どおりに配分するので、少数派の高年も $200$ 人が確保されます。

EXAMPLE 3(誤差の種類を見分ける)

次の誤差は標本誤差か非標本誤差か。
(a) 別の2,000人を選び直したら平均が少し変わった → 標本誤差($n$ で縮む)。
(b) 調査票の集計で入力ミスがあった → 非標本誤差($n$ では消えない)。
(c) 平日昼の電話調査で在宅者に偏った → 非標本誤差(選択バイアス)

まとめ

第3章 3-3、ポイントを整理します。

これで第3章の「データの集め方」パートはひと区切りです。次回 3-4 点推定(一致性・不偏性) からは、いよいよ集めた標本から母数を言い当てる本題へ。「なぜ標本分散は $n-1$ で割るのか」という 3-1 で残した宿題も、不偏性の導出として回収します。