標準誤差 – スタンダードエラーはレビュー評価の安心材料
講座レビューを毎日受け取っている私にとって、標準誤差(ひょうじゅんごさ)という値は、不確実なデータから信頼する情報を引き出すための重要な安心材料です。
英語では「Standard Error(スタンダード・エラー)」と呼ばれ、「SE」と略されることもあります。では、標準誤差が何故重要なのか、どうぞご一読ください。
標準誤差とは
標準誤差は、母集団(全データ)の平均値をサンプル(一部のデータ)に基づいて推定する際に用いられる指標です。
たとえば、私の講座を受講した30人から得られたレビューの平均値が「4.3」とします。
標準誤差が「±0.3」と算出された場合、母集団の平均レビュー値は「4.0~4.6」の間にあると推定できます。
この推定値は、現時点のサンプルに基づくもので、将来的に変動する可能性があります。
しかし、短期間(例えば3カ月程度)はこの範囲内に収束すると考えることができ、日々の評価を見る際の大きな安心材料となります。
悪い評価を受けたとしても、最終的には推定範囲内に戻るから大丈夫! と考えられるだけで、ストレスを軽減することができるからです。
標準誤差の計算
標準誤差の計算式は、以下のとおりです。
標準誤差 = 標準偏差 ÷ √ データの件数
標準偏差は平均値からのばらつきを示し、データの件数を平方根で割ることで、サンプルサイズの影響を適切に考慮します。
例えば、高校3年生男子の平均身長が170cm、標準偏差が5cm、サンプルサイズが25人の場合、標準誤差は「5÷√25」→「5÷5」で1cmになります。つまり、全国の男子高校生の平均身長は、169cmから171cmの範囲に収まると推定できます。
標準偏差をデータ件数の平方根で割る意味
標準偏差は、1σ(シグマ)で表される平均からのばらつきの範囲です。
データ件数が増えても、標準偏差自体に変化はありません。しかし、平均値の精度は上がっていきます。これは、データの件数が増えるほど、サンプルが母集団に近づくためです。
この平均値の精度の高まりは、サンプルサイズが倍になっても、平均値の信頼性が倍になるわけではありません。
サンプルサイズを2倍にしても、平均値の信頼性の増加はそれよりも小さいです。
先の高校生の例で、4倍、100人分のデータを分析しても、信頼性の増加は4倍にはなりません。では、信頼性はどのように高まっていくのか?
このデータの件数が増えることによる信頼性の高まりは、データの件数の平方根に比例するのだ、ということが判明しました。
そこには中心極限定理というものが絡んでくるのですが、今回の記事では標準誤差にフォーカスを当てているため、ここはそういうことが証明されているのだ、という理解でとどめておいてください。
どうしても理解したい人へ
データの件数が増えれば増えるほど、分散の値は小さくなっていきます。
不偏分散は母分散をマイナス1して補正して求めますからね。つまり、サンプル数が多くなるということは、母分散に近づく、つまり分散が小さくなっていくことを表しています。
分散は変動を個数で割った偏差平方の平均値ですが、この分散をもう1回個数で割ると、平均値の精度を表す値が出てきます。
ただし、分散の値を使っているため、データのスケール(偏差平方で2乗しているため)が異なっており、出現した値は直感的ではありません。
そのため、その計算結果の平方根を取ることで、平均値の精度である標準誤差が出てくるわけです。分散の平方根が標準偏差ですからね。
分散÷データの個数 → 標準偏差÷√データの個数
本来は分散からわかる公式なのですが、出現する値が直感的ではないため、平方根を取っているということになります。
したがって、データのらばらつきである標準偏差を、データの件数の平方根で割ることで、平均値の推定母平均を算出できるわけです。
おわりに
標準誤差はレビューを受けている人たちにとって、非常に強力な値だと信じています。
ただ、繰り返しになりますが、標準誤差は現時点で計測した推定母平均であり、未来永劫この値が留まらないということを覚えておいてください。
私自身も平均レビュー4.3を維持するために、わかりやすい指導を心がけます。