第2章 2-8 / 確率と確率分布

離散分布② ポアソン・幾何分布 — 稀な事象の件数と初成功までの試行回数

このページで学ぶこと

離散分布の2回目は、ポアソン分布幾何分布です。前回(2-7)の二項分布が「決まった回数のうち何回成功するか」だったのに対し、今回の2つは少し視点が違います。ポアソン分布は「一定時間・空間で稀な事象が何件起きるか」、幾何分布は「初めて成功するまでに何回かかるか」を表します。

ポアソン分布は、二項分布で「$n$ を大きく・$p$ を小さく」した極限として自然に現れます。前回の二項分布が土台になるので、つながりを意識しながら読んでみてください。期待値・分散の結果と、どんな場面で使うのかをセットで押さえれば、試験でも実務でも迷いません。

さえちゃん
さえ

今日の2つは「件数」と「回数」の分布だよ! ポアソンはめったに起きないことが何件起きる?、幾何は初成功まで何回かかる?。場面がはっきり分かれてるから、使いどころとセットで覚えると一生忘れないよ!

1. ポアソン分布 ─ 稀な事象の件数

ポアソン分布は、一定の時間や空間の中で、めったに起きない事象が何件起きるかを表す分布です。1時間あたりの来店客数、1ページあたりの誤植数、ある交差点で1日に起きる事故件数──こうした「件数(カウント)」のモデルとして広く使われます。

FORMULA

平均発生件数 $\lambda$(ラムダ、$\lambda>0$)のポアソン分布に従う $X$ の確率関数(pmf): $$P(X=k)=\frac{\lambda^{k} e^{-\lambda}}{k!}\qquad(k=0,1,2,\dots)$$ $\lambda$ は「単位時間・単位空間あたりに平均して何件起きるか」を表すパラメータです。$e$ は自然対数の底(約 $2.718$)、$k!$ は $k$ の階乗です。

期待値と分散

POINT

ポアソン分布では、期待値と分散がどちらも $\lambda$ に一致するという美しい性質があります。 $$E[X]=\lambda,\qquad V[X]=\lambda$$ 「平均件数も、そのばらつき(分散)も同じ $\lambda$」という覚えやすさが特徴です。実データで平均と分散が近い値なら、ポアソン分布で近似できるサインになります。

0 1 2 3 4 5 6 発生件数 k 確率 ポアソン分布 λ = 2(E[X]=V[X]=2)

$\lambda=2$ のポアソン分布。$k=1,2$(平均 $\lambda=2$ 付近)が最も起こりやすい

二項分布の極限としてのポアソン分布

ポアソン分布は、二項分布 $\mathrm{Bin}(n,p)$ で「試行回数 $n$ を非常に大きく、成功確率 $p$ を非常に小さく、ただし平均 $np$ を一定値 $\lambda$ に保つ」という極限をとると現れます。直感的には「チャンスは無数にあるが、1回あたりの成功確率はごくわずか。でも平均すると $\lambda$ 件起きる」という状況です。

POINT

$np=\lambda$ を一定に保ったまま $n\to\infty$(このとき $p=\lambda/n\to0$)とすると、 $$\binom{n}{k}p^{k}(1-p)^{n-k}\ \longrightarrow\ \frac{\lambda^{k}e^{-\lambda}}{k!}$$ 二項分布がポアソン分布に近づきます。これが「ポアソンは稀な事象の分布」と呼ばれる理由です。

この対応のうれしい副産物が、期待値・分散の確認です。二項分布の $E[X]=np$、$V[X]=np(1-p)$ で $np=\lambda$ とおくと、$E[X]=\lambda$、$V[X]=\lambda(1-p)\to\lambda$($p\to0$ なので $1-p\to1$)。前回(2-7)の結果が、そのままポアソンの $E[X]=V[X]=\lambda$ につながっています。

EXAMPLE(ポアソン)

あるコールセンターには1分あたり平均 $\lambda=2$ 件の電話がかかってくるとします。1分間にちょうど3件かかってくる確率は?

$$P(X=3)=\frac{2^{3}e^{-2}}{3!}=\frac{8\times e^{-2}}{6}\approx\frac{8\times0.1353}{6}\approx 0.180$$ 約 $18\%$。また期待値も分散も $\lambda=2$ なので、「平均2件、標準偏差 $\sqrt{2}\approx1.41$ 件」と見積もれます。

2. 幾何分布 ─ 初めて成功するまでの試行回数

幾何分布は視点が変わって、成功確率 $p$ のベルヌーイ試行をくり返し、初めて成功するまでにかかった試行回数 $X$ の分布です。「サイコロで初めて6が出るまで何回振るか」「初めてアタリを引くまで何回くじを引くか」といった場面で使います。

FORMULA

成功確率 $p$ の幾何分布に従う $X$ の確率関数(pmf、$k$ 回目で初成功): $$P(X=k)=(1-p)^{k-1}\,p\qquad(k=1,2,3,\dots)$$ $k-1$ 回連続で失敗(確率 $(1-p)^{k-1}$)し、$k$ 回目に成功(確率 $p$)する、という意味です。

期待値と分散

POINT

幾何分布($k=1,2,\dots$ の定義)の期待値と分散: $$E[X]=\frac{1}{p},\qquad V[X]=\frac{1-p}{p^{2}}$$ $E[X]=1/p$ は直感的です。成功確率が $p$ なら、平均すると「$1/p$ 回に1回」成功する、つまり初成功までに平均 $1/p$ 回かかる、ということです。

1 2 3 4 5 6 7 初成功までの試行回数 k 確率 幾何分布 p = 0.3(E[X]=1/p≈3.33)

$p=0.3$ の幾何分布。$k=1$ が最も高く、回数が増えるほど確率は単調に減る(右に裾を引く)

EXAMPLE(幾何)

当たる確率 $p=0.3$ のくじを、当たるまで引き続けます。何回目で初めて当たるかを $X$ とすると、$X$ は $p=0.3$ の幾何分布に従います。

  • 3回目で初めて当たる確率:$P(X=3)=(0.7)^{2}(0.3)=0.49\times0.3=\mathbf{0.147}$
  • 期待値:$E[X]=\dfrac{1}{0.3}\approx\mathbf{3.33}$ 回
  • 分散:$V[X]=\dfrac{1-0.3}{0.3^{2}}=\dfrac{0.7}{0.09}\approx\mathbf{7.78}$

「平均すると3〜4回目くらいで初当たり」と見積もれます。図のとおり1回目が最も起こりやすく、回を追うごとに確率が下がっていくのが幾何分布の形です。

3. 使いどころの整理

2つの分布は「何を数えているか」がはっきり違います。混同しないよう、場面とセットで整理しておきましょう。

分布表すものpmf$E[X]$$V[X]$
ポアソン$(\lambda)$ 一定時間・空間で
稀な事象が起きる件数
$\dfrac{\lambda^{k}e^{-\lambda}}{k!}$ $\lambda$ $\lambda$
幾何$(p)$ 初めて成功するまでの
試行回数
$(1-p)^{k-1}p$ $\dfrac{1}{p}$ $\dfrac{1-p}{p^{2}}$
POINT

判別のコツは「件数を数えるならポアソン、初成功までの回数を数えるなら幾何」。さらに、ポアソンは「平均=分散=$\lambda$」、幾何は「平均=$1/p$」を真っ先に思い出せれば、ほとんどの問題に対応できます。なお幾何分布には「初成功までの失敗回数($k=0,1,2,\dots$)」で定義する流儀もあり、その場合は $E[X]=\dfrac{1-p}{p}$ になります。問題文がどちらの定義かを確認しましょう。

まとめ

第2章 2-8、ポイントを整理します。

ここまでで主要な離散分布が一通りそろいました。次回 2-9 連続分布①(一様・指数分布) からは、連続型の分布に進みます。和($\sum$)が積分($\int$)に変わるだけで、期待値・分散の考え方はそのまま使えますよ。

さえちゃん
さえ

ポアソンは「件数」、幾何は「初成功までの回数」──場面で覚えたら強いよ! ポアソンの $E=V=\lambda$、幾何の $E=1/p$ は即答できるようにしておこう。次はいよいよ連続分布、$\sum$ が $\int$ になるだけだから怖くないよ!