モーメント — 平均・分散から歪度・尖度まで
ここまでで期待値 $E[X]$(2-5a)と分散 $V[X]$(2-5b)を学びました。実はこの2つは、モーメントという一本の物差しの上に並んだ仲間です。モーメントとは「$X$ を $k$ 乗して期待値をとった量」のこと。$k$ を $1,2,3,4$ と上げていくと、平均 → 分散 → 歪度 → 尖度 と、分布の特徴が次々に取り出せます。
本ページでは、原点まわりのモーメント $E[X^k]$ と、平均まわりの中心モーメント $E[(X-\mu)^k]$ を定義し、それぞれの次数が分布の「位置・広がり・傾き・とがり具合」のどれを表すのかを整理します。分布の形を数字で語るための共通言語、という気持ちで読んでみてください。
平均と分散がバラバラの公式に見えてた人、朗報だよ! 実は両方とも「モーメント」という同じ仲間なの。$k$ 乗の $k$ を上げていくだけで、分布の特徴がどんどん出てくる──そんな便利な道具を今日はマスターしよう!
1. モーメントとは何か(直感)
物理で「モーメント」というと、てこの回転のしやすさ(力 × 距離)を思い出す人もいるかもしれません。統計のモーメントもイメージは近く、ある基準点からの距離を $k$ 乗して、確率で重み付けして足し集めた量です。基準点を「原点(ゼロ)」にとるか「平均」にとるかで、2種類のモーメントに分かれます。
原点まわりの $k$ 次モーメント(基準点はゼロ): $$\mu_k' = E[X^k]$$ 平均まわりの $k$ 次モーメント(中心モーメント)(基準点は平均 $\mu=E[X]$): $$\mu_k = E\big[(X-\mu)^k\big]$$ ここで $k$ は $1,2,3,\dots$ という次数です。離散型なら $E[X^k]=\sum_{i=1}^{n} x_i^k\, p_i$ のように、$x_i$ を $k$ 乗して確率 $p_i$ で重み付けします。
ダッシュ付きの $\mu_k'$ が原点まわり、ダッシュなしの $\mu_k$ が平均まわり、と区別します。次数 $k$ を上げるほど、平均から遠い値(外れ値)の影響が強調されていくのがポイントです。$k$ 乗で距離が誇張されるので、$k$ が大きいほど「裾の方の振る舞い」に敏感な指標になります。
なぜ中心モーメントを使うのか
分布の形を語りたいときは、位置(平均)をそろえてから比べたいですよね。中心モーメントは平均 $\mu$ を基準にしているので、分布を左右に平行移動しても値が変わりません。「どこにあるか」ではなく「どんな形か」だけを取り出せる──だから3次以上の形の指標には中心モーメントを使うのです。
2. 1次・2次モーメント ─ 平均と分散の再確認
まずは見慣れた低次から。1次と2次のモーメントが、すでに学んだ平均・分散そのものであることを確認します。
1次モーメント = 平均
原点まわりの1次モーメントは、定義そのままで $$\mu_1' = E[X^1] = E[X] = \mu$$ つまり平均です。分布の「位置(重心)」を表します。
なお平均まわりの1次モーメントは $\mu_1 = E[(X-\mu)] = E[X]-\mu = \mu-\mu = 0$ となり、つねにゼロです。平均からのズレを符号付きで足すと打ち消し合うからで、これは「平均が分布の重心である」ことの言い換えでもあります。
2次の中心モーメント = 分散
平均まわりの2次モーメントは、分散の定義そのものです。 $$\mu_2 = E\big[(X-\mu)^2\big] = V[X] = \sigma^2$$ 分布の「広がり(ばらつき)」を表します。2-5b で導いた $V[X]=E[X^2]-(E[X])^2$ は、原点まわりの2次モーメント $\mu_2'=E[X^2]$ を使って $\mu_2 = \mu_2' - \mu^2$ と書き直せます。
こうして見ると、平均は「1次」、分散は「2次(中心)」と、モーメントの次数で番号付けできます。次の3次・4次が、いよいよ分布の形に踏み込む新しい指標です。
3. 3次モーメントと歪度(左右の偏り)
3次の中心モーメント $\mu_3 = E[(X-\mu)^3]$ を考えます。2乗とちがって3乗は符号を保つのがミソ。平均より大きい側($X-\mu>0$)の値は正のまま、小さい側($X-\mu<0$)は負のまま3乗されます。だから左右の偏りがあると、打ち消し合わずに符号付きで残るのです。
歪度の定義
ただし $\mu_3$ は単位が「$X$ の3乗」になっていて、分布のスケール(広がり)によって大きさが変わってしまいます。そこで $\sigma^3$ で割って単位をなくし(無次元化し)、純粋に「偏り具合」だけを取り出したものが歪度(わいど、skewness)です。
歪度: $$\text{歪度} = \frac{E\big[(X-\mu)^3\big]}{\sigma^3} = \frac{\mu_3}{\sigma^3}$$ 標準偏差 $\sigma$ の3乗で割ることで無次元になり、分布のスケールによらず形の偏りだけを表します。
符号と分布の形の対応
歪度の符号で、分布がどちらに裾を引いているかがわかります。
- 歪度 > 0(正の歪み):右に長い裾。山は左に寄り、平均が中央値より右にくる傾向(例:所得分布)
- 歪度 = 0:左右対称(例:正規分布)
- 歪度 < 0(負の歪み):左に長い裾。山は右に寄り、平均が中央値より左にくる傾向
歪度の符号と分布の形:裾を引いている向きが符号と一致する(右裾なら正、左裾なら負)
コツは「裾を引いている方向と符号が一致する」と覚えること。右に長い裾なら歪度はプラスです。山がどちらに寄っているかではなく、裾がどちらに伸びているかで判断しましょう。
4. 4次モーメントと尖度(とがり・裾の重さ)
次は4次の中心モーメント $\mu_4 = E[(X-\mu)^4]$。4乗するとすべて正になり、しかも平均から遠い値ほど極端に大きく効きます。そのため4次モーメントは「外れ値(裾)の重さ」を測る指標になります。歪度と同じく、スケールをそろえるため $\sigma^4$ で割って無次元化します。
尖度(せんど、kurtosis): $$\text{尖度} = \frac{E\big[(X-\mu)^4\big]}{\sigma^4} = \frac{\mu_4}{\sigma^4}$$ 正規分布ではこの値がちょうど $3$ になります。
超過尖度(−3する流儀)
尖度は正規分布を基準にして比べることが多いので、$3$ を引いて「正規分布をゼロ」にそろえた量がよく使われます。これを超過尖度と呼びます。
超過尖度: $$\text{超過尖度} = \frac{E\big[(X-\mu)^4\big]}{\sigma^4} - 3$$
- 超過尖度 > 0:正規分布よりとがって裾が重い(外れ値が出やすい)
- 超過尖度 = 0:正規分布と同程度
- 超過尖度 < 0:正規分布より平たく裾が軽い(外れ値が出にくい)
試験や統計ソフトでは「尖度」と書いてあっても、$-3$ 済みの超過尖度を指していることが多いので注意してください。「正規分布が基準(0 or 3 のどちら)か」を毎回確認するクセをつけると間違えません。なお歪度・尖度は第6章 6-2 でもう一度、データ(標本)側の計算として登場します。
| 次数 $k$ | 中心モーメント | 正規化した指標 | 表すもの |
|---|---|---|---|
| 1 | $E[X-\mu]=0$ | —(平均 $\mu$ は原点1次) | 位置 |
| 2 | $E[(X-\mu)^2]=\sigma^2$ | —(分散そのもの) | 広がり |
| 3 | $E[(X-\mu)^3]$ | 歪度 $=\dfrac{\mu_3}{\sigma^3}$ | 左右の偏り |
| 4 | $E[(X-\mu)^4]$ | 尖度 $=\dfrac{\mu_4}{\sigma^4}$($-3$ で超過尖度) | とがり・裾の重さ |
5. (参考)モーメント母関数
最後に名前だけ紹介しておきます。すべての次数のモーメントをまとめて生み出す便利な関数として、モーメント母関数 $M_X(t)=E[e^{tX}]$ というものがあります。これを $t$ で微分して $t=0$ を代入すると $k$ 次モーメント $E[X^k]$ が次々に取り出せる、という仕組みです。
モーメント母関数: $$M_X(t) = E\big[e^{tX}\big]$$ これは2級の必須範囲ではありません。「モーメントをまとめて扱う道具がある」程度に押さえておけば十分です。
2級の学習では、まずは「平均・分散・歪度・尖度がモーメントで統一的に説明できる」という見通しが持てれば合格点です。母関数は発展トラックや上位級で深掘りしましょう。
6. 数値例で確かめる
簡単な離散分布で、各次のモーメントを実際に計算してみます。
確率変数 $X$ が $x=0,1,2,3$ をそれぞれ確率 $0.5,\,0.3,\,0.15,\,0.05$ で取るとします。低次のモーメントを求めましょう。
まず平均(1次): $$\mu = E[X] = 0(0.5)+1(0.3)+2(0.15)+3(0.05) = 0.75$$ 次に2次の原点モーメント $E[X^2]$: $$E[X^2] = 0^2(0.5)+1^2(0.3)+2^2(0.15)+3^2(0.05) = 1.35$$ 分散(2次中心): $$\sigma^2 = E[X^2]-\mu^2 = 1.35 - 0.75^2 = 0.7875,\qquad \sigma \approx 0.8874$$
3次の中心モーメントを直接計算すると $\mu_3 = E[(X-\mu)^3] \approx 0.6562$。よって歪度は $$\frac{\mu_3}{\sigma^3} \approx \frac{0.6562}{0.6988} \approx 0.939$$ 正の値なので、この分布は右に裾を引いていることが数字でも確認できます(実際 $x=3$ 側に小さな確率の裾がありますね)。
実務では「平均と分散だけ見て安心しない」ことが大切です。平均・分散が同じでも、歪度が大きければ片側に大きなリスクが潜み、尖度が大きければ稀な大きい外れ値が出やすい。モーメントを2次で止めず、3次・4次まで見ると、分布の性格がぐっと立体的に見えてきます。
まとめ
第2章 2-6、ポイントを整理します。
- 原点モーメント:$\mu_k'=E[X^k]$(基準はゼロ)
- 中心モーメント:$\mu_k=E[(X-\mu)^k]$(基準は平均。平行移動で不変)
- 1次:$E[X]=\mu$(平均=位置)。中心1次はつねに $0$
- 2次中心:$E[(X-\mu)^2]=\sigma^2$(分散=広がり)
- 3次→歪度:$\dfrac{E[(X-\mu)^3]}{\sigma^3}$。符号と裾の向きが一致(正なら右裾)
- 4次→尖度:$\dfrac{E[(X-\mu)^4]}{\sigma^4}$。正規分布で $3$、$-3$ して超過尖度
- モーメント母関数 $M_X(t)=E[e^{tX}]$ は「こういう道具がある」程度でOK
次回 2-7 離散分布①(ベルヌーイ・二項分布) では、いよいよ具体的な分布に入ります。ベルヌーイ分布と二項分布の期待値・分散を、今日までに学んだ期待値・分散の道具を総動員して導出します。本章の導出の山場のひとつです。
平均・分散・歪度・尖度が「次数ちがいの兄弟」だってわかったね! 次数を上げるほど外れ値に敏感になる、がキーワードだよ。次はいよいよ二項分布──和に分解して期待値・分散を出す、かっこいい技を見せちゃうから楽しみにしててね!