こんにちは! Excel講師の榊裕次郎です。
この記事では「確率」「確率変数」「期待値」の3つについて、完全理解できるよう記載しました。
統計解析の勉強分野でも、比較的簡単な内容ですので、ぜひお気軽にご一読ください。
それでは解説していきます!
確率とは?
サイコロで、1の目が出る確率は1/6 = 約16.7%、これが「確率」です。
天気予報でよく聞く降水確率も、雨が降る「確率」ですが、サイコロのように目の結果のみを示すものでなく、求められる%には定義が盛り込まれているものもあります。
降水確率の場合、気象庁のWebサイトから降水確率の説明を引用しますと……
予報区内で1mm以上の雨の降る確率を、6時間毎に10%単位で発表します。例えば、18時から24時までの降水確率が20%というのは、その期間に1mm以上の雨の降る可能性が100回中20回あるという意味です。確率が高いと雨量が多くなるという意味ではありません。
【参考】
https://www.jma.go.jp/jma/kishou/know/kurashi/yoho.html
6時間のあいだに1mm以上の雨が降ったら~という定義なので、100%でもその期間ずっと雨が降り続いている、ということではないんですね。
断続的に降る、という表現はそういった意味で使われています。
確率の求め方、また確率から情報を読み取ることは難しいのですが、今回ご紹介する期待値で扱う確率は、サイコロの目のような単純な確率を使っていきますのでご安心ください。
サイコロの目は6通りあり、1回の試行で目的の目が出る確率は 1/6 で今回はOKです。
確率変数とは?
次に「確率変数」について解説していきます。
代表的な例えだと、サイコロを振って出た目の数のことです。
1が出るかもしれないし、5が出るかもしれない。
変数は「箱」をイメージしていただき、最初は空の状態、サイコロが振られて初めて「箱」に値が入ります。
「箱」に1が入る確率は1/6
「箱」に2が入る確率は1/6
「箱」に3が入る確率は1/6
「箱」に4が入る確率は1/6
「箱」に5が入る確率は1/6
「箱」に6が入る確率は1/6
1~6までの値は、1/6の確率を持っています。
そのため、確率を持った1~6の値のどれかが、「箱(変数)」に入ってから値が定まるため、この値が入った箱を確率変数と呼んでいます。
サイコロを振って3が出た → 3が確率変数となります。
期待値とは?
その名のとおり期待する値なので、サイコロのように単なる出た目の情報ではなく、これは「量」を含んでいます。
そのため、サイコロに得点という「量」を含めてみましょう。
1が出たら1点、2が出たら2点という具合です。
サイコロを10,000回振った場合、イカサマダイスではなく、サイコロに歪みもなく、確率が純粋に1/6のものなら、だいたい何点ぐらいに収束するでしょうか?
期待値は、確率変数×確率で求まります。
サイコロの場合は、6つの確率変数があるため、
=(1×1/6)+(2×1/6)+(3×1/6)+(4×1/6)+(5×1/6)+(6×1/6)
= 3.5
となり、10回程度の挑戦では多少得点差が出るかもしれませんが、10,000回も振った場合、だいたい35,000点前後に収束していきます。
試しに、お金持ちのYouTuberが、AさんとBさん2人を呼び、10,000回サイコロを振って、得点の多かった方に1,000万円プレゼント! というイベント企画をしたとします。
ExcelのRANDBETWEEN(ランダムビトウィーン)関数で、デモンストレーションしてみます。
期待値が3.5なので、10,000回振ると、だいたい35,000点に収束します。
再計算ボタン、F9キーを押して何度確認しても、その範囲内に落ち着いていることがわかりますね。
再計算1回目
再計算2回目
再計算3回目
いかがでしょうか?
ちなみに10万回、100万回と試行回数を増やすと、さらに幅が収束していくので、お時間がございましたら、Excelを開いて同じように試してみてください。
期待値はこのとおり、1回あたりのサイコロを振って得られる得点のことを指します。
【ケーススタディ】期待値
日常生活の中でも、期待値を探してみましょう。
例えば、コンビニエンスストアのナチュラルローソンでは、年末年始に「お楽しみワインボトルキャンペーン」をやっています。
それをモデルとして、以下のようなサンプルワインキャンペーンを作ってみましょう。
表示価格
- 1等 50,000円のワイン 1本
- 2等 10,000円のワイン 4本
- 3等 5,000円のワイン 15本
- 4等 3,500円のワイン 20本
- 5等 3.000円のワイン 20本
販売するワインは全部で60本。
年末年始の客寄せ大サービスということで、儲け0として考えてみましょう。
このキャンペーンを開催するとき、お楽しみワイン1本あたりの価格をどのように決めればいいでしょうか?
原価はこの価格とします。
原価
- 1等 30,000円のワイン 1本
- 2等 8,000円のワイン 4本
- 3等 3,000円のワイン 15本
- 4等 1,500円のワイン 20本
- 5等 1.000円のワイン 20本
確率変数は、各ワインの値段になります。
確率は60本限定のため、60が分母となります。
期待値
30,000 ×(1/60) = 500
8,000×(4/60) = 533
3,000×(15/60) = 750
1,500×(20/60) = 500
1.000×(20/60) = 333
= 500 + 533 + 750 + 500 + 333
= 2,617円
ということになり、粗利0キャンペーンは1本あたり2,617円で販売すればOKということになります。
お客様目線からすると、5等で外れても3,000円で買うワインは飲めるので、こいつははずれがないキャンペーンだ! と思えるわけです。
こういうところで期待値は使われているのですね。
まとめ
確率、確率変数、期待値、以上がこちらの記事の説明となりました。
このくらいであれば、比較的覚えやすい部分でもあります。
確率の中で降水確率をご紹介しましたが、統計解析では確率の求め方が煩雑です。
サイコロのように単純な確率もあれば、降水確率のように定義が定まっている確率もあります。
また、数字を予測しながら求める確率の手法もありますので、確率は非常に難しい値です。
Excelの関数を覚えたばかりのように、どういうシーンでどの関数を使えばいいかわからない! と嘆く場面に、統計解析ではよく直面します。
これは日々勉強して成長していくしかありませんね。
引き続きこのようにわかりやすさを努めて記載していますので、どうぞよろしくお願いいたします。
それではまた!