Udemyで講座を受講しよう!
統計

母集団と標本 – 標本の抽出方法

Yujiro Sakaki

統計学では、データを母集団として扱うか、標本として扱うかによって、計算式の作成方法が若干異なります。

まずは、分析の前提となる母集団と標本について、しっかりと学習しておきましょう。

Check Point

この記事で学習できること

  • 母集団
  • 標本
  • 5つの標本抽出法
    • 単純無作為抽出法
    • 系統抽出法
    • 多段抽出法
    • 集落抽出法(クラスター抽出法)
    • 層別抽出法

母集団とは?

母集団とは、研究や分析の対象となる全体のことを指します。例えば、ある国の全住民、特定の企業の全従業員などが母集団にあたります。

母集団のデータを集めることは不可能に近いため、より小さな「標本」を利用して分析を行うのが一般的です。

2020年度の国勢調査ですら、回収率は81.3%でした。

2015年の最終回収率は71.0%だったので、新型コロナウイルスの蔓延で在宅時間が多かったことが回収率アップの要因といえますが、全数でない限り母集団データとは言えません。

ですので、母集団データを扱う機会は極めて稀なことなのです。

標本とは?

標本とは、母集団の一部の要素の集合データを指します。この標本を用いることで、母集団全体の特性を推測することができます。

一般的には、収集したデータを標本として分析をすることがほとんどなので、母集団と標本の話はここでおしまいですが、もう少し深堀していきましょう。

母集団から標本データを抽出するというケースも考えてみましょう。母集団から標本データを抽出するときに重要なことは、標本データに偏りがあってはいけません

ここでは、調査の候補が決まっており、けれども偏りなく標本を抽出するためにはどうしたらいいか? その標本抽出法について、代表的な5つの抽出法をご紹介します。

5つの標本抽出法

標本を抽出する方法は、主に5つの方法が挙げられます。

単純無作為抽出法

この方法では、母集団の各要素が等しい確率で選ばれます。

例えば、Excelなどを用いて母集団データにそれぞれ乱数を発生させます。各データと紐づけ、昇順に並び替えて上位100名を選出する、という方法がこれにあたります。

※ 乱数は等確率だ、という前提です。

系統抽出法

母集団を一定の順序で並べ、定期的な間隔で要素を選択します。例えば、ある列に並んだ人々から、10人ごとに1人を選ぶ場合がこれに該当します。

これはコンピューターが手元にないとき、ランダムで人を選ばなければいけない、というシーンでも使えそうな手法ですよね。

多段抽出法

これは、複数の段階を経て標本を選びます。例えば、まず都道府県をランダムに選び、そして地域を選んで、調査地区を設定するようなイメージです。

都道府県の全数調査をする場合、コストや人件費などが莫大にかかります。それをできるかぎり緩和させるため、このように調査範囲を絞り込んでいく方法です。

ただし、多段抽出法は偏りが出やすいので、厳密なランダムではなく、前もって調査地区の規模をグルーピングしてから抽出したほうがいいでしょう。

ここは恣意的な操作が入ることもありますが、偏りをなくすためであれば問題はありません。都市部ばかりの抽出になってしまったら、それこそ問題ですからね。

集落抽出(クラスター抽出)法

母集団を似たようなグループ(クラスター)に分け、ランダムにいくつかのクラスターを選び、選ばれたクラスター内の全要素を調査します。

例えば、いくつかの学校を選び、選ばれた学校の全生徒を調査するようなイメージです。こちらも偏りが想定されますが、選ばれた標本の中で全数調査ができるメリットがあります。

私が小学生のときも、そういえば何かの調査対象として選ばれたらしく、ピンク色をした紙にアンケートを取った記憶がありますね。

何のアンケートだったかは覚えがないのですが…。

層別抽出法

母集団を、異なる特徴を持つ層に分け、各層からランダムに標本を抽出します。これにより、母集団の多様性を標本に反映させることができます。

代表的なのは、大学でアンケートを取る際、その大学生の男女比率が6:4であれば、アンケートも男女6:4で取るといった具合です。男性3、女性7の割合でアンケートを取得したら、女性の意見の偏りが出てしまいますからね。

以上、5つの標本抽出方法でした。

まとめ

母集団と標本は、統計学において基本的な概念です。

また、標本の抽出方法を覚えておくことで、偏りのない標本抽出が可能となるでしょう。5つの抽出法は、統計の現場でなくてもワークショップやセミナー、パーティーなどでも応用できそうですよね。

以上、母集団と標本についての学習でした。母集団と標本について、そして標本の抽出方法を5つ、しっかりと覚えておいてください。

次の記事は、母集団で求める分散と標本で求める分散に入ります。まずはこちらの記事のご一読、おつかれさまでした。

Advertisement
ABOUT ME
榊 裕次郎
榊 裕次郎
Excel講師
1981年10月生まれのてんびん座、東京都出身。趣味は、旅行と料理とワイン。2024年は、佐賀県に行って「呼子のイカ」を思いっきり食べたいです。

仕事では2023年も引き続き、青森・秋田・岩手でのお仕事依頼、お待ちしております!
記事URLをコピーしました