独立性に関する注意と第6章総復習
第6章のラストです。前半で独立性を扱うときの注意点を簡潔に整理し、後半は第6章の総復習問題8問で章全体の知識を一気に振り返ります。確率は問題を解いてこそ身につく分野。最後の総仕上げ、しっかり手を動かしていきましょう。
第6章ラスト! 説明はサクッと、問題でしっかり総復習しよう! 間違えても気にしなくて大丈夫。「どこでつまずいたか」がわかることが、何よりの収穫だよ!
1. 独立性を扱うときの注意点
独立性は確率論の中心的な概念ですが、いくつかの陥りやすい落とし穴があります。試験対策としても、実務でデータを扱うときの心がけとしても、ここで簡潔に押さえておきましょう。
注意1:「排反」と「独立」を混同しない
これは6-3で詳しく扱ったポイントですが、もう一度確認しておきます。
- 排反:同時に起こらない(P(A∩B) = 0)
- 独立:互いの確率に影響しない(P(A∩B) = P(A) × P(B))
この2つはまったく別の概念です。むしろ排反な事象は、ほとんどの場合「独立ではない」のでした(Aが起こるとBは絶対起こらないという、強い情報になるため)。
注意2:「独立っぽい」と「独立」は別物
実際のデータを扱うときに気をつけたいのが、「直感的に独立だろう」と決めつけることです。
- 「身長と血液型」は独立っぽいけど、本当に独立?(実は微妙な関係があるかも)
- 「コイン投げが連続で表」のとき、次も独立だと感じられるか?(直感は「そろそろ裏が出る」と思いがち)
確率論で「独立」と言ったら、それは数式 P(A∩B) = P(A) × P(B) が成り立つという意味。直感的な「無関係っぽい」とは厳密には別物です。試験では「独立とする」と問題文に明記されていることが多いので、その指示に従って計算しましょう。
注意3:3つ以上の事象の独立性
事象が3つ以上ある場合の独立性は少し複雑です。3級の試験ではあまり深入りしませんが、「全体が独立」であるためには「すべての組み合わせで独立」である必要があるとだけ覚えておけば十分です。
たとえば事象A, B, Cが完全に独立というには、P(A∩B) = P(A)×P(B)、P(B∩C) = P(B)×P(C)、P(A∩C) = P(A)×P(C)、そして P(A∩B∩C) = P(A)×P(B)×P(C) のすべてが成り立つ必要があります。直感的には「2つずつ独立なら全体も独立」と思いがちですが、それだけでは不十分な場合がある──これが3級レベルを少し超える内容です。
実務でデータを扱うときは、「これは本当に独立?」と一度立ち止まる習慣が大切です。安易に「独立だから掛け算」と進めると、間違った確率を計算してしまうことがあります。
2. 第6章の知識を総ざらい
ここから第6章の総復習問題に入ります。出題範囲は、6-1から6-5までの全範囲。難度は基礎 → 標準 → 応用と段階的に上げています。
必ず手を動かして書き出してから解答を見るようにしてください。間違えた問題こそ宝物。「どこでつまずいたか」を確認することで、苦手な部分が浮き彫りになります。
問題 1 ─ 事象の関係を判定する【6-1】
サイコロを1回振る試行で、A=「3以下」、B=「偶数」とします。次の問いに答えてください。
- (1) A∪B、A∩B、A^c をそれぞれ集合で表してください
- (2) AとBは排反でしょうか
解答を見る
A = {1, 2, 3}、B = {2, 4, 6} です。
(1)
- A∪B = {1, 2, 3, 4, 6}(A、Bのいずれかに含まれる)
- A∩B = {2}(両方に共通する)
- A^c = {4, 5, 6}(Aに含まれない)
(2) A∩B = {2} ≠ ∅ なので、AとBは排反ではありません。「2」が両方に含まれているからですね。
問題 2 ─ 加法定理【6-1, 6-2】
ジョーカーを除いた52枚のトランプから1枚引くとき、その1枚が「スペードまたはエース(A)」である確率を求めてください。
解答を見る
事象S = スペード、事象E = エース、とします。
- P(S) = 13/52 = 1/4
- P(E) = 4/52 = 1/13
- P(S∩E) = 1/52(スペードのエース1枚)
加法定理より、
P(S∪E) = P(S) + P(E) − P(S∩E) = 13/52 + 4/52 − 1/52 = 16/52 = 4/13
スペース13枚+エース4枚で17枚と思いがちですが、「スペードのエース」が両方に含まれているので1枚引いて16枚。これが加法定理の本質です。
問題 3 ─ 余事象を使う【6-2】
コインを5回連続で投げるとき、少なくとも1回は表が出る確率を求めてください。
解答を見る
「少なくとも1回は表」の余事象は「5回とも裏」です。各回が独立な試行なので、
P(5回とも裏) = (1/2)⁵ = 1/32
したがって、求める確率は
P(少なくとも1回は表) = 1 − 1/32 = 31/32
「少なくとも〜」ときたら反射的に余事象。第6章で繰り返し出てきたパターンですね。
問題 4 ─ 独立な試行【6-3】
サイコロを3回振るとき、3回とも6が出る確率と、1回も6が出ない確率をそれぞれ求めてください。
解答を見る
サイコロの各回の試行は独立なので、確率の掛け算が使えます。
3回とも6が出る確率
各回で6が出る確率は 1/6。3回独立なので、
P(3回とも6) = 1/6 × 1/6 × 1/6 = 1/216 ≒ 0.00463
1回も6が出ない確率
各回で6以外が出る確率は 5/6。3回独立なので、
P(1回も6が出ない) = 5/6 × 5/6 × 5/6 = 125/216 ≒ 0.579
サイコロを3回振っても、6が1回も出ない確率は約58%。意外と多いことに気づきます。
問題 5 ─ 復元と非復元の比較【6-3, 6-4】
袋に当たりくじ3本、外れくじ7本(合計10本)が入っています。次の2つの場合について、2回連続で当たりを引く確率をそれぞれ求めてください。
- (1) 1回目を戻してから2回目を引く(復元抽出)
- (2) 1回目を戻さずに2回目を引く(非復元抽出)
解答を見る
(1) 復元抽出
袋の中身は変わらないので、各試行は独立。
P(両方当たり) = 3/10 × 3/10 = 9/100 = 0.09
(2) 非復元抽出
1回目で当たりを引いた後、袋には当たり2本・外れ7本(合計9本)が残ります。条件付確率と乗法定理を組み合わせて、
- P(1回目当たり) = 3/10
- P(2回目当たり|1回目当たり) = 2/9
P(両方当たり) = 3/10 × 2/9 = 6/90 = 1/15 ≒ 0.067
復元なら9%、非復元なら約6.7%。「戻すかどうか」だけで確率が変わります。
問題 6 ─ 条件付確率(クロス集計から)【6-4】
ある会社の60人の社員に、好きな飲み物(コーヒー or 紅茶)を聞いたところ、次のような結果になりました。
| コーヒー | 紅茶 | 合計 | |
|---|---|---|---|
| 男性 | 20 | 10 | 30 |
| 女性 | 12 | 18 | 30 |
| 合計 | 32 | 28 | 60 |
- (1) 1人を無作為に選んだとき、その人が女性で紅茶好きの確率
- (2) 紅茶が好きとわかったとき、その人が女性である確率
解答を見る
(1) 女性かつ紅茶好きの確率
全60人のうち、女性で紅茶好きは18人。
P(女性∩紅茶) = 18/60 = 3/10 = 0.30
(2) 紅茶好きとわかったときの女性の確率(条件付確率)
条件は「紅茶好き」、知りたいのは「女性」。紅茶好きに絞った世界で考えます。紅茶好きは合計28人、そのうち女性は18人なので、
P(女性|紅茶) = 18/28 = 9/14 ≒ 0.643
(1)と(2)は別の答えになります。条件と事象を取り違えないのが条件付確率の基本です。
問題 7 ─ 乗法定理【6-4】
ある工場で作られた製品の不良率は8%です。検査員がこの製品を検査するとき、不良品を正しく不良品と判定する確率は92%です。良品を誤って不良品と判定してしまう確率は3%です。
製品が不良品で、かつ検査員が不良品と判定する確率を求めてください。
解答を見る
事象A = 不良品、事象B = 検査で不良判定、とします。
- P(A) = 0.08(不良率)
- P(B|A) = 0.92(不良品を不良と判定する確率:これが条件付確率)
求めるのは「不良かつ不良判定」、つまり P(A∩B)。乗法定理を使います。
P(A∩B) = P(A) × P(B|A) = 0.08 × 0.92 = 0.0736(7.36%)
全製品のうち約7.4%が「真の不良品で、かつ検査でも不良と判定された」ことになります。
問題 8 ─ ベイズの定理【6-5】
問題7と同じ条件です。すなわち:
- 製品の不良率:8%
- 不良品を正しく不良品と判定する確率:92%
- 良品を誤って不良品と判定する確率:3%
検査員がある製品を「不良品」と判定しました。この製品が本当に不良品である確率を求めてください。
解答を見る
ベイズの定理の出番です。1,000個の製品で考えてみましょう。
- 不良品:1,000 × 0.08 = 80個
- 良品:1,000 × 0.92 = 920個
それぞれの検査結果:
- 不良品80個のうち、不良判定:80 × 0.92 = 73.6個
- 良品920個のうち、不良判定(誤判定):920 × 0.03 = 27.6個
- 不良判定の合計:73.6 + 27.6 = 101.2個
不良判定された製品のうち、本当に不良品なのは73.6個。
P(不良 | 不良判定) = 73.6 / 101.2 ≒ 0.727(72.7%)
式で書くなら:
P(A|B) = P(A) × P(B|A) ÷ [P(A) × P(B|A) + P(A^c) × P(B|A^c)]
= 0.08 × 0.92 ÷ [0.08 × 0.92 + 0.92 × 0.03]
= 0.0736 ÷ 0.1012 ≒ 0.727
検査の精度(92%)よりも、「本当に不良である確率」は少し低くなります(72.7%)。事前確率(不良率8%)の影響でこうなる──これが6-5で学んだベイズの定理の効果です。
ちなみに、6-5の病気の検査の問題(事前確率1%、検査精度90%)では結果は約15%でした。今回は事前確率が8%とそれよりずっと高いため、結果も72.7%とかなり高くなっています。事前確率が結果を大きく左右することが、2問を比べるとよくわかりますね。
3. 第6章を終えて
8問お疲れさまでした。第6章「確率」を通して学んだことを、最後に俯瞰しておきましょう。
| 節 | テーマ | 身につけた力 |
|---|---|---|
| 6-1 | 事象と確率 | 用語の整理、3つの確率定義、加法定理 |
| 6-2 | 練習問題 | 余事象や場合の数を使った計算力 |
| 6-3 | 独立性 | 独立と排反の区別、独立試行の掛け算 |
| 6-4 | 条件付確率 | 「世界が縮む」感覚、乗法定理 |
| 6-5 | ベイズの定理 | 結果から原因を推測する力 |
| 6-6 | 本ページ | 独立性の落とし穴、章全体の総復習 |
確率を学んだ意味
確率は、第1〜5章で学んだ記述統計とは違う方向の知識です。「まだ起きていないこと」「不確実なこと」を扱う力。次の第7章で学ぶ確率変数と確率分布の土台になり、その先のデータサイエンス・AI・意思決定の世界へとつながっていきます。
特にベイズの定理が示してくれた「結果から原因を推測する」発想は、現代社会で生き抜くうえでの思考のフレームそのもの。陽性が出ても本当に病気とは限らない、メールの単語だけで完全にスパムとは決められない──こうした「確率的に考える」姿勢は、データを扱うあらゆる場面で武器になります。
CHAPTER 6 完了!
第6章「確率」、ここで完了です。 全6ページ、長い旅でしたね。
この章で学んだ確率の知識は、第7章で扱う確率変数と確率分布の土台になります。「サイコロを振った結果」を変数として扱い、その値がどんなパターンで現れるかを見ていく章。記述統計(第1〜5章)と確率(第6章)が組み合わさって、データの世界がもう一段深く見えてきます。
第6章コンプリート、本当におつかれさまでした! 確率は最初難しく感じても、問題を解いた数だけ得意になる分野です。間違えた問題があれば、ぜひ何度も解き直してくださいね!