第7章 7-2 / 確率変数と確率分布

平均・分散・標準偏差

このページで学ぶこと

前回学んだ確率変数と確率分布。今回は、その確率変数の「中心」と「ばらつき」を測る方法を整理します。第3章で学んだ平均・分散・標準偏差が、確率変数の世界でも再登場します。

本ページでは、期待値 E(X)、分散 V(X)、標準偏差の3つを順に押さえ、最後にaX+b の形に変換した確率変数の性質を学びます。第3章の知識が、確率を重みにする形で蘇ってくる感覚を体感していきましょう。

さえ

このページのキーワードは「重み付き平均」！　第3章で学んだ平均・分散・標準偏差が、確率を重みにして再登場するよ。新しい概念じゃなくて、同じ考え方の応用だから安心してね！

1. 確率変数の期待値

まずは確率変数の期待値から。これは確率変数の「平均」のような値で、「長く繰り返したときに収束する平均値」を表します。

サイコロを振り続けるとどうなるか

サイコロを1回振って出た目を確率変数 X とします。たくさん振って出た目の平均を取ると、どんな値に近づくでしょうか?

X は1〜6のいずれかで、それぞれ1/6の確率。直感的に、「真ん中あたりの値」に落ち着きそうな気がしますね。実際に計算してみると：

(1 + 2 + 3 + 4 + 5 + 6) ÷ 6 = 21 ÷ 6 = 3.5

この 3.5 が、サイコロの期待値です。実際にサイコロを大量に振って平均を取ると、3.5 に近づいていきます（第6章で学んだ大数の法則ですね）。

期待値の定義

FORMULA

確率変数 X が値 x₁, x₂, ..., xₙ を確率 p₁, p₂, ..., pₙ で取るとき：
E(X) = x₁p₁ + x₂p₂ + … + xₙpₙ

これは「値 × 確率」の合計です。確率を重みにした平均──いわゆる「重み付き平均」になっています。サイコロの場合は各確率が等しい1/6なので、結果は単純な平均と同じになるわけです。

サイコロの期待値を式で計算

EXAMPLE

E(X) = 1×(1/6) + 2×(1/6) + 3×(1/6) + 4×(1/6) + 5×(1/6) + 6×(1/6)
　　 = (1 + 2 + 3 + 4 + 5 + 6) × (1/6)
　　 = 21 × (1/6)
　　 = 3.5

「重心」としての期待値

期待値を視覚的に理解するなら、確率分布の「重心」と捉えるのがわかりやすいです。確率を「重さ」と見立てて、棒グラフ全体のバランスを取る点が期待値です。

サイコロの確率分布の重心は3.5。各確率を「重さ」として、左右のバランスが取れる点

偏った確率分布の期待値

もし確率が等しくない場合は、確率の大きい方に重心が寄ります。たとえば「1が出やすいサイコロ」を考えてみましょう。

EXAMPLE

ある不公平なサイコロが、次の確率で目を出すとします。

X	1	2	3	4	5	6
P(X=x)	1/2	1/10	1/10	1/10	1/10	1/10

E(X) = 1×(1/2) + 2×(1/10) + 3×(1/10) + 4×(1/10) + 5×(1/10) + 6×(1/10)
　　 = 0.5 + 0.2 + 0.3 + 0.4 + 0.5 + 0.6
　　 = 2.5

公平なサイコロでは3.5だった期待値が、1が出やすい不公平サイコロでは2.5まで小さくなりました。確率の重さがある方に、重心が引っ張られるのがよくわかります。

POINT

期待値 E(X) は、確率を重みにした「重み付き平均」。確率変数の中心的な値を表します。「長く繰り返したときの平均」と理解してもよいです。

さえ

毎日朝のニュース番組でも「占い」ってやっているよね。あれも年間を通じて、星座の平均順位が6.5位になると思うんだよね！　特定の星座に偏りがなければ、だけど！

2. 確率変数の分散と標準偏差

期待値が「中心」を表すなら、その「ばらつき」を表すのが分散と標準偏差です。第3章で学んだ概念が、確率変数の世界でも同じ役割を果たします。

分散の定義

FORMULA

確率変数 X の分散 V(X) は、「X と期待値 E(X) の差の2乗」の期待値:
V(X) = E[(X − E(X))²]
実際の計算式：
V(X) = (x₁ − E(X))² × p₁ + (x₂ − E(X))² × p₂ + … + (xₙ − E(X))² × pₙ

考え方は第3章と同じです。「中心からどれだけずれているかの2乗」を、確率を重みにして平均する。これが分散です。

サイコロの分散を計算

EXAMPLE

公平なサイコロの分散を計算します。E(X) = 3.5 でした。

V(X) = (1−3.5)² × (1/6) + (2−3.5)² × (1/6) + (3−3.5)² × (1/6)
　　 + (4−3.5)² × (1/6) + (5−3.5)² × (1/6) + (6−3.5)² × (1/6)
　　 = (6.25 + 2.25 + 0.25 + 0.25 + 2.25 + 6.25) × (1/6)
　　 = 17.5 × (1/6)
　　 = 35/12 ≒ 2.92

さえ

期待値は3.5だけど、実際はどれくらいばらつくのか？　を求めているよ。2.92は「m²」と同じで2乗している値だから直感的にはわからない状態。これを、次の平方根に戻すと、この2.92の値がしっくりくるよ。

標準偏差

FORMULA

標準偏差 σ(X) = √V(X)

第3章と同じく、分散の平方根が標準偏差です。分散は元の単位の2乗になっているので、平方根を取って元の単位に戻します。サイコロの標準偏差は √(35/12) ≒ 1.71。

この値の意味は「サイコロを振ると、平均的に3.5から±1.71くらいズレる」ということ。確率変数の値がどれくらい中心から散らばるかを示しています。

さえ

サイコロを60回振って、1〜6の目が見事に10回ずつ出た！　なんて普通あり得ないよね。理論的にはそうなるはずでも、実際には期待値3.5から±1.71くらいズレるのが普通。これが標準偏差の意味！　逆に言えば、何回振っても全然この範囲を外れた値ばかり出るなら、いかさまダイス?　って疑いがかかるってわけ！

分散の便利な計算公式

分散には、もうひとつ計算しやすい公式があります。

FORMULA

V(X) = E(X²) − (E(X))²
「Xの2乗の期待値」から「Xの期待値の2乗」を引く

サイコロで確認してみましょう。

EXAMPLE

E(X²) = 1²×(1/6) + 2²×(1/6) + 3²×(1/6) + 4²×(1/6) + 5²×(1/6) + 6²×(1/6)
　　　 = (1 + 4 + 9 + 16 + 25 + 36) × (1/6)
　　　 = 91 × (1/6)
　　　 = 91/6 ≒ 15.17

E(X) = 3.5 だったので、(E(X))² = 12.25

V(X) = 91/6 − 12.25 = 91/6 − 49/4 = (182 − 147) / 12 = 35/12 ≒ 2.92

定義通りに計算した結果と一致しました。計算量が少なくて済むので、定義式より使いやすい場面が多いです。

3. aX+b の期待値・分散・標準偏差

確率変数をaX+b の形に変換することは、実務でもよくあります。たとえば気温を℃から華氏°Fに変換したり、模試の素点を偏差値に変換したり。このとき、期待値・分散・標準偏差はどう変わるでしょうか?

期待値の性質

FORMULA

E(aX + b) = a × E(X) + b

期待値は「変換と同じように動く」──直感に合う性質です。Xを2倍にして3を足したら、期待値も2倍にして3を足せばよい、ということ。

分散の性質

FORMULA

V(aX + b) = a² × V(X)

ここで気をつけたいのが2つあります。

① bは消える：定数bを足してもばらつきは変わらないので、分散には影響しません。データ全体を「右にずらす」だけだと、ばらつきの幅は同じですよね。

② aは2乗：aで何倍かすると、ばらつきもa倍になりますが、分散は「ばらつきの2乗」を表すので、a² 倍になります。

標準偏差の性質

FORMULA

σ(aX + b) = |a| × σ(X)

分散の平方根が標準偏差なので、a² の平方根である |a|（絶対値）が掛かります。aがマイナスでも、ばらつき自体はプラスの値です。bは標準偏差にも影響しません。

具体例

EXAMPLE

確率変数 X が E(X) = 50、V(X) = 100、σ(X) = 10 だとします。Y = 2X + 30 の期待値・分散・標準偏差を求めてください。

期待値：E(Y) = 2 × E(X) + 30 = 2 × 50 + 30 = 130

分散：V(Y) = 2² × V(X) = 4 × 100 = 400

標準偏差：σ(Y) = |2| × σ(X) = 2 × 10 = 20

定数の30は分散と標準偏差には影響せず、期待値だけが影響を受けます。「変換しても、ばらつきの本質は変わらないが、中心は移動する」のがイメージできますね。

偏差値との関係

模試などでよく使われる偏差値も、aX+b の発想で作られています。

偏差値 = (X − μ) / σ × 10 + 50　　※（偏差÷標準偏差）× 10 + 50

ここで X は素点、μ は平均、σ は標準偏差。これを変形すると Y = aX + b の形（a = 10/σ, b = 50 − 10μ/σ）になっています。どんなテストでも、偏差値の平均は50、標準偏差は10に揃う──これは aX+b の性質を巧妙に使った変換なんです。

統計検定3級 - 試験形式の練習問題

この性質は3級の試験で頻出です。実際の試験問題に近い形で1問解いてみましょう。

EXAMPLE - 試験形式

確率変数 X の標準偏差が 5、分散が 25 である。 Y = 2X + 3 と定めるとき、確率変数 Y の標準偏差と分散をそれぞれ求めなさい。

解答を見る

標準偏差：σ(aX+b) = |a| × σ(X) より

σ(Y) = |2| × 5 = 10

分散：V(aX+b) = a² × V(X) より

V(Y) = 2² × 25 = 4 × 25 = 100

ポイントは3つです。

① 定数の +3 は無視：分散にも標準偏差にも影響しません。データ全体を「右にずらす」だけなので、ばらつきの幅は変わらないからです。

② 標準偏差は |a| 倍（=2倍）：絶対値が掛かるのは、aがマイナスでも標準偏差はプラスの値だから。

③ 分散は a² 倍（=4倍）：分散は「ばらつきの2乗」を表すので、aを2乗します。標準偏差を2乗すると分散になる関係(σ² = V) と整合的ですね。

試験では「標準偏差は2倍、分散は4倍」と素早く判断できるようになっておきましょう。

POINT

確率変数の線形変換 aX+bでは、期待値は素直に動き、分散はa²倍、標準偏差は|a|倍になります。bは中心の位置を変えるだけで、ばらつきには影響しません。偏差値や単位変換でも、この性質が背後で働いています。

4. 第3章との関係を整理

ここで一度立ち止まって、第3章で学んだ「データの平均・分散・標準偏差」と、本ページで学んだ「確率変数の期待値・分散・標準偏差」の関係を整理しておきましょう。

観点	第3章 (データ)	第7章 (確率変数)
対象	実際に観測されたデータ	これから観測される確率変数
中心	平均 (mean)	期待値 E(X)
ばらつき	分散・標準偏差	分散 V(X)・標準偏差 σ(X)
計算の重み	各データを等しく扱う	確率を重みにする
aX+bの性質	同じ性質が成り立つ	同じ性質が成り立つ

対象は違いますが、本質はまったく同じです。データの平均・分散は、確率変数のサンプル（実際に観測された値）から計算した期待値・分散の推定値と考えることもできます。記述統計と確率論が、ここで美しくつながるのを実感してもらえれば十分です。

まとめ

第7章2回目の本ページ、ポイントを整理しておきましょう。

期待値 E(X)：「値 × 確率」の合計。確率を重みにした重み付き平均
分散 V(X)：「(X−E(X))² の期待値」。中心からのばらつきの2乗の期待値
分散の便利公式：V(X) = E(X²) − (E(X))²
標準偏差 σ(X)：分散の平方根。元の単位に戻る
aX+bの性質：E(aX+b) = aE(X)+b、V(aX+b) = a²V(X)、σ(aX+b) = |a|σ(X)
第3章との関係：データの平均・分散と本質は同じ。重みが「等しい」か「確率」かの違い

次回は二項分布と正規分布。実際の場面でよく登場する2つの代表的な確率分布を整理します。コインを何回も投げるような場面で活躍する二項分布と、世の中のあらゆる場面に現れる正規分布──統計学の中でもっとも重要な分布に出会う回です。

さえ

期待値・分散・標準偏差──第3章で学んだ概念が、確率変数の世界でちゃんと使えたね！　次回は二項分布と正規分布！　統計学の主役級の分布たちに会いに行こう！