講座リクエスト受付フォーム
PeachRoom

統計学の最初のハードル「標準偏差」

Yujiro Sakaki

①平均値、②中央値、③最頻値、④最大値、⑤最小値、⑥レンジと学習しました。

次に、基本統計量の中でも難所となる値、⑦分散、⑧標準偏差を学習していきましょう。

標準偏差は、特に①平均値をサポートする値として使われます。

Check Point

この記事で学習できること

  • 偏差
  • 偏差平方
  • 分散
  • 標準偏差

それでは、学習を進めていきましょう!

この記事は長いので、時間のあるときにゆっくり熟読してね!

標準偏差

平均値は、平らに均した値であるため、ピンポイントの値でしかわかりません。均してしまったら、どんな姿をしたデータ群だったかがわからなくなってしまいます。

空き家状態だった家が整地されてしまうと、そこに何が建っていたのか? しばらくすると忘れてしまいますよね。平らに均す、ということはそういうことです。

そこで、平に均す前の状況を評価してくれるのが、標準偏差です。わかりやすいように、飲み会のシーンを例にしてみましょう。

標準偏差は、データが平均値からどれくらい離れているかを示す値だと思ってください。この値をこれから「ばらつき」と表現していきます。

例えば、10人が参加した飲み会で、お会計が1人当たり6,000円だったとします。標準偏差の値が300円だとしたら、おおむね10人の飲食代は均等だったと評価できます。

では、標準偏差が1,500円だったらどうでしょう? ばらつき具合が大きくなると、得をした人と損をした人と二分しているのではないか? と考える必要があります。

お酒を飲んで、何回もお代わりした人と、ソフトドリンク2杯だけ頼んだ人の差をイメージしてください。そういった出来事が含まれていると想定できうる値です。

割り勘のような平均値は、すべての情報が平らに均されてしまうため、どういう内訳になっていたのかがわからなくなります。

そこで、全体のばらつきを教えてくれるのが「標準偏差」という値です。つまり、平均値のサポート役というわけですね。

300円と1,500円の値の違い、この感覚をしっかりとこの記事で確認していきましょう。

標準偏差は、統計学で非常に重要な値です。この記事を通じて、標準偏差をしっかりと理解できるよう、頑張っていきましょう!

標準偏差の範囲は、約68%のデータが集まる!?

標準偏差は不思議な値で、平均値のブレ幅を教えてくれるだけではなく、その範囲内に全体の約68%のデータが集まるよ! ということも教えてくれます。

先ほどの例で説明を続けると、平均値6,000、標準偏差300ということは、5,700~6,300の間に約68%のデータが集中している、と考えられます。

標準偏差が1,500だったら、4,500~7,500の間に約68%のデータが集中していると考えられます。そのため、データがばらついている(飲んだ人と飲まなかった人の幅が大きい)と考えられるわけです。

もちろん、すべてのケースで毎回必ず68%内に収まるというわけではなく、これは統計学上の一般的な目安となります。

世の中の不確かなことは正規分布に従うのだ、と仮定して物事を分析したほうが早いため、この68%暫定ルールを採用しています。

この正規分布については、次に記載しますね。なので、今はさらりと流してください。

標準偏差のプラスマイナスの範囲のことを1シグマといい、ギリシャ文字・シグマの小文字「σ」を使って、1σと表記します。(大文字Σは「合計」を意味する記号です)

プラスマイナスなので 「±1σ」 と表現します。

平均値6,000、標準偏差300とすると、5,700~6,300が、±1σの範囲となります。また、標準偏差を英語読みで読む機会も多いので、ここで合わせて覚えておきましょう。

標準偏差 = Standard Deviation(スタンダード・ディービエーション)といい、アルファベット2文字の「sd」という略語を使います。

平均値は「ave」と略されることがあり、PowerPointのようなスライドに平均値と標準偏差を合わせて記載するシーンがあったら、「ave±sd」と記載することもあります。

こちらも覚えておくといいでしょう。

正規分布について

続いて、正規分布について学習をしましょう。

正規分布という概念は、アブラーム・ド・モアブルによって1733年に導入をされ、

  • ピエール・シモン・ラプラス
  • アドリアン・マリ・ルジャンドル
  • カール・フリードリヒ・ガウス

と、数多くの数学者が拡張していきました。正規分布という名前がついたのは19世紀ごろなので、一部不明瞭な解説となりますが、

  • チャールズ・サンダース・パース
  • フランシス・ゴルトン
  • ヴィルヘルム・レキシス

らによって、現在の正規分布に完成していったことは間違いありません。

つまり、アブラーム・ド・モアブルの初期導入から100年以上も数学の研究が続いて、ようやく正規分布という現代の形になっていったわけですね。

世の中の不確かなものは、正規分布に従うのだ

さて、この正規分布というのは以下のキャプチャのように、釣鐘状をした曲線のことを指していますが、これはどのような意味を持っているのでしょうか?

正規分布図

実例として、平成27年の男子高校3年生の身長データを見てみましょう。

以下のキャプチャは、統計局から持ってきたデータをエクセルのVBAを使って加工し、グラフ化しました。釣鐘状の波形が見えてきますよね。

平成27年男子高校生の身長

ちょっと形は欠けているとはいえ、立派に釣鐘状をした形となっています(左側が少し欠けている理由として、測定時にまだ成長途中の男子学生がいるという解釈もできるでしょう。大学生になって身長が伸びる人もいますからね)。

平均身長は171.3cm、標準偏差は5.8cmという計算結果になりました(統計局のデータは常にアップデートされているため、計算しなおすと若干のズレはあるかもしれません)。

つまり、165.5cm ~ 177.1cmの人の割合が、全体の約68%だということになります。

このように、世の中の不確かなことを実際に時間とお金をかけて調べてみると、若干のズレはあれど、正規分布に近づくことが数学者によって発見されたのです。

こういう情報があると、手元のデータの平均値と標準偏差さえわかれば、だいたいのデータ分布像を予測することができます。身長の例でいえば、洋服のサイズの生産バランスなども設計することができますよね。

そのため、統計学では正規分布に従うことを前提として、基本統計量に含まれる代表値(平均値・中央値・最頻値)を見ていくわけです。

私のExcel講座も、地球上にいるすべての人たちに指導するとしたら、どのようなレビュー結果となるでしょうか?

5段階評価としたら、どんなに努力をして素晴らしい講座ができたとしても、平均レビューポイントは「3」に収束する、ということになります。

学びが必要な人、そうでない人、そうでないけれども必要だと感じた人、やっぱり不要だった人、ものすごく満足を得た人、まったくわからなかった人、きれいな釣鐘状になることでしょう。これが正規分布というものです。

人間関係でも同じというマインドで私はいます。

自分と気の合う人と気の合わない人も、同じ割合だという考えでいると、実際にストレスの溜まる人と遭遇したとき、気分がずっと楽になるはずです。

講師業を始めた初期段階では、自分の指導は誰からでも受け入れられたいと思っていました。常にレビューは★5であるべきだ。ただ、それは疲れるだけでした。

以下、昔の自分へのメッセージとして。

人生で出会うすべての人が、自分に対して常に好意的ではありません。誰からも好かれたいと考えていたら、この正規分布を頭の中に入れると、とても気持ちが楽になるはずです。

⑦分散、⑧標準偏差

標準偏差の求め方は、Excelやプログラムを使うと一瞬で求めることができるのですが、この計算式は確実に覚えておきたい内容です。

標準偏差の求め方
  1. データ群の平均値を求める。
  2. 各データより「実データ – 平均値」で偏差を求める
  3. 偏差を2乗して、偏差平方を求める
  4. 偏差平方の合計値を求めて、変動を出力する
  5. 変動をデータの個数で割り、⑦分散を求める
  6. 分散の値を平方根にして、⑧標準偏差を求める

長いですよね。

それぞれの計算フローをExcelのキャプチャを使って解説していきます。ゆっくりとキャプチャを追っていってください。

データ群の平均値を求める

標準偏差を出力する最初の手順です。データ群の「平均値」を出力します。

データの「平均値」を求めた

各データより「実データ – 平均値」で偏差を求める

平均からの距離を求めていきます。この値を「偏差(へんさ)」といいます。

それぞれの偏差を求める

偏差を2乗して、偏差平方を求める

この偏差の平均値を求めれば、データのばらつきを求めることができるのですが、プラス方向の偏差と、マイナス方向の偏差の値がそれぞれ打ち消しあってしまい、合計値が0になってしまいます。

偏差の合計は0になるという性質があるため、これ以上の分析ができなくなってしまうのです。平均値が平らに均された値ゆえに、こうなってしまうのです。

では、偏差のデータを生かしたまま負の数を取り除くためにはどうしたらいいか?

数学者たちは絶対値にすればいいという案と、偏差を2乗して負の数を取り払えばいいという案を出しました。

実際に検証した結果、絶対値では散らばり度合いが大きくても小さく表示されてしまうため、偏差を2乗して負の数を取り払う案を採用しました。

正確に統計学の書籍を紐解くと…

  • 絶対値は計算(微分)がしづらい
  • 2乗和は数学的に扱いやすく、他の理論(回帰分析など)にもつながる

とあるのですが、いまはこのイメージで十分です。

mとm²で考えるとわかりやすいよ。3mと10mの差は7mだよね。これが絶対値でのズレの感覚です。でも、2乗して9m²と100m²の差で考えると、偏差のズレ具合が違って評価できます。

結論から言うと、2乗したほうが実際のズレの感覚とマッチしていた、ということなんですね。ズレを2次元の空間で評価していた。コンピューターもない時代に、昔の人はすごいですね

そのため、偏差を2乗する「偏差平方」を求めるというのが正解だと導いたわけです。

偏差を2乗して負の数を取り除いた

偏差平方の合計値を求めて、変動を出力する

偏差平方によって、負の数が取り除かれました。この合計値はかなり大きくなってしまうのですが、この偏差平方の合計値を「変動(へんどう)」といいます。

偏差平方の合計値「変動」を出力

変動は基本統計量には含まれません。扱いづらい値ですからね。

変動をデータの個数で割り、⑦分散を求める

偏差の平均値を求めたかったのですから、変動をデータの個数で割ることで平均値を求めることができます。

これが、データの散らばり具合を示す「⑦分散」という値になります(※ キャプチャ内は手順を示した番号のため、「⑤ 分散」となっています)。

「変動÷個数」で分散を求める

ただし、偏差平方のときに2乗してしまっているので、単位が変わってしまい、馴染みのない値になってしまっています。

単位が変わった? ここがつまづきポイントです。

さえちゃんの吹き出し説明でもありましたが、10m×10mであれば、100m² という値になり、これは広さの値として私たちが利用できる単位となっています。

同じ要領で、10円×10円をした場合は100円² という値になります。

そのため、出現した値は普段利用しない単位の数値データとなるため、分散が出力されても私たちは直接その値を読み取れないのです。

単位が異なるために、数字が読み取れないことを「スケールが異なる」と表現します。せっかくデータの散らばりを求めることができたのに、少し困ってしまいますよね。

分散の値を平方根にして、標準偏差を求める

読みやすい値に変換するため、2乗したから最後にその逆をやればいい。

√分散 → 標準偏差

つまり、この分散の値を平方根で戻します。「円²」を「円」に戻してあげる。ここではじめて元の単位に変換できたので、平均値からの ±1σ の距離を知ることができました。

分散を平方根で元の単位に戻す

キャプチャの例では「1,075 ± 225(ave ± sd)」となります。

この範囲に68%のデータが集まる。つまり標準偏差内で、それくらいのばらつきはあるだろう。これを上回るようであれば、平均から大きくズレているので、どのようなデータか確認する必要があるよね。そんな気づきを得ることができます。

はい、標準偏差の出力方法は以上となります。おつかれさまでした。

まとめ

以上が、⑦分散と⑧標準偏差でした。

ただ、まだここまでの理解では不十分なんです。いまご紹介した標準偏差の求め方は、母集団に対する計算方法、つまり手元に必要なデータがすべて揃ったときに使える計算方法だということです。

一般的にデータ分析をする際には、すべてのデータを集めることは不可能に近い。

時間とお金がかかりますし、集計期間中にデータが集まったとしても、データは時間とともに動くので、集まったデータからまた揺らぎが発生します。

人口データだって、いまこの瞬間で産声を上げている赤ちゃんもいれば、息を引き取って人生を卒業した人もいらっしゃるからです。

そのため、標本データ(サンプル)を使うことの方が分析の世界ではほとんどです。違いは、分散の求め方となるのですが、この分散の求め方はまた別の機会にご紹介します。

まずは標準偏差の基本的な計算方法をしっかりと覚えておきましょう! 統計学の基礎中の基礎なので、これを知らないと話にならないくらいの内容ですね

次の記事は、母集団と標本 – 標本の抽出方法に進んでいきましょう。

最終確認日:2025年11月19日

Advertisement
ABOUT ME
榊 裕次郎
榊 裕次郎
Excel講師
1981年10月生まれのてんびん座、東京都出身。趣味は、旅行と料理とワイン。2025年もラストスパートですね! 皆さんはどんな1年でしたでしょうか?

2025年が最後までいい1年でありますように、がんばっていきましょう!
記事URLをコピーしました