講座リクエスト受付フォーム
PeachRoom

母集団と標本 – 標本の抽出方法

Yujiro Sakaki

統計学では、データを母集団として扱うか、標本として扱うかによって、計算式の作成方法が若干異なります。

分析の前提となる母集団と標本について、基本をしっかりと押さえておきましょう。

Check Point

この記事で学習できること

  • 母集団
  • 標本
  • 5つの標本抽出法
    • 単純無作為抽出法
    • 系統抽出法
    • 多段抽出法
    • 集落抽出法(クラスター抽出法)
    • 層別抽出法

母集団は英語でpopulation、標本はsample。Excelの関数もPとSが末尾についているのは、母集団として計算するか、標本として計算するかを使い分けているんだよ

母集団とは?

母集団とは、研究や分析の対象となる全体のことを指します。例えば、ある国の全住民、特定の企業の全従業員などが母集団にあたります。

しかし、母集団のデータを集めることは不可能に近いため、より小さな「標本」を利用して分析を行うのが一般的です。

新型コロナウイルスの蔓延で在宅業務を余儀なくされた2020年度の国勢調査ですら、回収率は81.3%でした。国勢調査のような大規模な調査でも、母集団全体のデータを完全に収集することは難しいのです。

ですので、母集団データを扱う機会は極めて稀なことなのです。

標本とは?

標本とは、母集団の一部の要素の集合データを指します。この標本を用いることで、母集団全体の特性を推測することができます。

一般的には、収集したデータを標本として分析をすることがほとんどなので、母集団と標本の話はここでおしまいですが、もう少し深堀していきましょう。

母集団から標本データを抽出する、というケースも考えてみます。母集団から標本データを抽出するときに重要なことは、標本データに偏りがあってはいけません

ここでは、調査の候補が決まっていて、けれども偏りなく標本を抽出するためにはどうしたらいいか? その標本抽出法について、代表的な5つの抽出法をご紹介します。

5つの標本抽出法

標本を抽出する方法は、主に5つの方法が挙げられます。

単純無作為抽出法

この方法では、母集団の各要素が等しい確率で選ばれます。

例えば、Excelなどを用いて母集団データにそれぞれ乱数を発生させます。各データと紐づけ、昇順に並び替えて上位100名を選出する、という方法がこれにあたります。

ただし、これを行うためには乱数を出力するための全該当データがないとダメなので、場合によっては処理が重くなってしまうこともあります。

1億を超える国民の中からランダムで1万人選ぶ場合、1億のデータ量が必要ですからね。

等しい確率で出力されることを前提にしているため、真の乱数は別の議論になります。興味のある人はこの記事もよろしくね

ExcelのRAND関数から考える「ランダム」の正体

系統抽出法

母集団を一定の順序で並べ、定期的な間隔で要素を選択します。例えば、ある列に並んだ人々から、10人ごとに1人を選ぶ場合がこれに該当します。

手元にコンピューターがないときに使える便利な手法でもありますね。デメリットとしては、周期性があるようなデータに関しては、偏りが発生してしまうリスクがあります。

例えば、5つ飛ばしでデータを取得していったら、休日データが全体的に多くなってしまった、というようなケースです。

多段抽出法

これは、複数の段階を経て標本を選びます。例えば、まず都道府県をランダムに選び、そして地域をランダムに選んで、調査地区をさらにランダムで絞り込むイメージです。

都道府県の全数調査をする場合、コストや人件費が莫大にかかります。それをできるかぎり緩和させるため、このように調査範囲を絞り込んでいく手法です。

多段抽出法は、そのまま実施すると偏りが出やすいので、あらかじめ調査地区の規模ごとにグルーピングしてから、そのグループ内でランダムに抽出すると、よりバランスの良い標本になります。

ここに恣意的な操作が入る場合もありますが、偏りを防ぐための調整であれば問題ありません。都市部ばかりの抽出になってしまったら、それこそ問題ですからね。

集落抽出(クラスター抽出)法

母集団を似たようなグループ(クラスター)に分け、ランダムにいくつかのクラスターを選び、選ばれたクラスター内を全数調査する場合が多いです。

例えば、特定の地域のいくつかの学校を選び、その学校内の全生徒を調査するようなイメージです。こちらも偏りが想定されますが、選ばれたクラスター内で全数調査が行えるため、コストや労力の削減が可能です。

私が小学生のとき、そういえば何かの調査対象として選ばれたらしく、ピンク色をした紙にアンケートを取った記憶がありますね。

何のアンケートだったかは覚えがないのですが…。

クラスターとは、ブドウの房をイメージした言葉なんですよ

層別抽出法

母集団を、異なる特徴を持つ層に分け、各層からランダムに標本を抽出します。これにより、母集団の多様性を標本に反映させることができます。

代表的なのは、大学でアンケートを取る際、その大学生の男女比率が6:4であれば、アンケートも男女6:4で取るといった具合です。男性3、女性7の割合でアンケートを取得したら、女性の意見の偏りが出てしまいますからね。

以上、5つの標本抽出方法でした。

まとめ

母集団と標本は、統計学において基本的な概念です。

また、標本の抽出方法を覚えておくことで、偏りのない標本抽出が可能となるでしょう。5つの抽出法は、統計の現場でなくてもワークショップやセミナー、パーティーなどでも応用できそうですよね。

以上、母集団と標本についての学習でした。母集団と標本について、そして標本の抽出方法を5つ、しっかりと覚えておいてください。

次の記事は、母集団で求める分散と標本で求める分散に入ります!

最終確認日:2025年11月19日

Advertisement
ABOUT ME
榊 裕次郎
榊 裕次郎
Excel講師
1981年10月生まれのてんびん座、東京都出身。趣味は、旅行と料理とワイン。2025年もラストスパートですね! 皆さんはどんな1年でしたでしょうか?

2025年が最後までいい1年でありますように、がんばっていきましょう!
記事URLをコピーしました