第6章 6-6 / 確率

独立性に関する注意と第6章総復習

このページで学ぶこと

第6章のラストです。前半で独立性を扱うときの注意点を簡潔に整理し、後半は第6章の総復習問題8問で章全体の知識を一気に振り返ります。確率は問題を解いてこそ身につく分野。最後の総仕上げ、しっかり手を動かしていきましょう。

さえちゃん
さえ

第6章ラスト! 説明はサクッと、問題でしっかり総復習しよう! 間違えても気にしなくて大丈夫。「どこでつまずいたか」がわかることが、何よりの収穫だよ!

1. 独立性を扱うときの注意点

独立性は確率論の中心的な概念ですが、いくつかの陥りやすい落とし穴があります。試験対策としても、実務でデータを扱うときの心がけとしても、ここで簡潔に押さえておきましょう。

注意1:「排反」と「独立」を混同しない

これは6-3で詳しく扱ったポイントですが、もう一度確認しておきます。

この2つはまったく別の概念です。むしろ排反な事象は、ほとんどの場合「独立ではない」のでした(Aが起こるとBは絶対起こらないという、強い情報になるため)。

注意2:「独立っぽい」と「独立」は別物

実際のデータを扱うときに気をつけたいのが、「直感的に独立だろう」と決めつけることです。

確率論で「独立」と言ったら、それは数式 P(A∩B) = P(A) × P(B) が成り立つという意味。直感的な「無関係っぽい」とは厳密には別物です。試験では「独立とする」と問題文に明記されていることが多いので、その指示に従って計算しましょう。

注意3:3つ以上の事象の独立性

事象が3つ以上ある場合の独立性は少し複雑です。3級の試験ではあまり深入りしませんが、「全体が独立」であるためには「すべての組み合わせで独立」である必要があるとだけ覚えておけば十分です。

たとえば事象A, B, Cが完全に独立というには、P(A∩B) = P(A)×P(B)、P(B∩C) = P(B)×P(C)、P(A∩C) = P(A)×P(C)、そして P(A∩B∩C) = P(A)×P(B)×P(C) のすべてが成り立つ必要があります。直感的には「2つずつ独立なら全体も独立」と思いがちですが、それだけでは不十分な場合がある──これが3級レベルを少し超える内容です。

POINT

実務でデータを扱うときは、「これは本当に独立?」と一度立ち止まる習慣が大切です。安易に「独立だから掛け算」と進めると、間違った確率を計算してしまうことがあります。

2. 第6章の知識を総ざらい

ここから第6章の総復習問題に入ります。出題範囲は、6-1から6-5までの全範囲。難度は基礎 → 標準 → 応用と段階的に上げています。

必ず手を動かして書き出してから解答を見るようにしてください。間違えた問題こそ宝物。「どこでつまずいたか」を確認することで、苦手な部分が浮き彫りになります。

問題 1 ─ 事象の関係を判定する【6-1】

サイコロを1回振る試行で、A=「3以下」、B=「偶数」とします。次の問いに答えてください。

解答を見る

A = {1, 2, 3}、B = {2, 4, 6} です。

(1)

  • A∪B = {1, 2, 3, 4, 6}(A、Bのいずれかに含まれる)
  • A∩B = {2}(両方に共通する)
  • A^c = {4, 5, 6}(Aに含まれない)

(2) A∩B = {2} ≠ ∅ なので、AとBは排反ではありません。「2」が両方に含まれているからですね。

問題 2 ─ 加法定理【6-1, 6-2】

ジョーカーを除いた52枚のトランプから1枚引くとき、その1枚が「スペードまたはエース(A)」である確率を求めてください。

解答を見る

事象S = スペード、事象E = エース、とします。

  • P(S) = 13/52 = 1/4
  • P(E) = 4/52 = 1/13
  • P(S∩E) = 1/52(スペードのエース1枚)

加法定理より、

P(S∪E) = P(S) + P(E) − P(S∩E) = 13/52 + 4/52 − 1/52 = 16/52 = 4/13

スペース13枚+エース4枚で17枚と思いがちですが、「スペードのエース」が両方に含まれているので1枚引いて16枚。これが加法定理の本質です。

問題 3 ─ 余事象を使う【6-2】

コインを5回連続で投げるとき、少なくとも1回は表が出る確率を求めてください。

解答を見る

「少なくとも1回は表」の余事象は「5回とも裏」です。各回が独立な試行なので、

P(5回とも裏) = (1/2)⁵ = 1/32

したがって、求める確率は

P(少なくとも1回は表) = 1 − 1/32 = 31/32

「少なくとも〜」ときたら反射的に余事象。第6章で繰り返し出てきたパターンですね。

問題 4 ─ 独立な試行【6-3】

サイコロを3回振るとき、3回とも6が出る確率と、1回も6が出ない確率をそれぞれ求めてください。

解答を見る

サイコロの各回の試行は独立なので、確率の掛け算が使えます。

3回とも6が出る確率

各回で6が出る確率は 1/6。3回独立なので、

P(3回とも6) = 1/6 × 1/6 × 1/6 = 1/216 ≒ 0.00463

1回も6が出ない確率

各回で6以外が出る確率は 5/6。3回独立なので、

P(1回も6が出ない) = 5/6 × 5/6 × 5/6 = 125/216 ≒ 0.579

サイコロを3回振っても、6が1回も出ない確率は約58%。意外と多いことに気づきます。

問題 5 ─ 復元と非復元の比較【6-3, 6-4】

袋に当たりくじ3本、外れくじ7本(合計10本)が入っています。次の2つの場合について、2回連続で当たりを引く確率をそれぞれ求めてください。

解答を見る

(1) 復元抽出

袋の中身は変わらないので、各試行は独立。

P(両方当たり) = 3/10 × 3/10 = 9/100 = 0.09

(2) 非復元抽出

1回目で当たりを引いた後、袋には当たり2本・外れ7本(合計9本)が残ります。条件付確率と乗法定理を組み合わせて、

  • P(1回目当たり) = 3/10
  • P(2回目当たり|1回目当たり) = 2/9

P(両方当たり) = 3/10 × 2/9 = 6/90 = 1/15 ≒ 0.067

復元なら9%、非復元なら約6.7%。「戻すかどうか」だけで確率が変わります。

問題 6 ─ 条件付確率(クロス集計から)【6-4】

ある会社の60人の社員に、好きな飲み物(コーヒー or 紅茶)を聞いたところ、次のような結果になりました。

コーヒー 紅茶 合計
男性201030
女性121830
合計322860
解答を見る

(1) 女性かつ紅茶好きの確率

全60人のうち、女性で紅茶好きは18人。

P(女性∩紅茶) = 18/60 = 3/10 = 0.30

(2) 紅茶好きとわかったときの女性の確率(条件付確率)

条件は「紅茶好き」、知りたいのは「女性」。紅茶好きに絞った世界で考えます。紅茶好きは合計28人、そのうち女性は18人なので、

P(女性|紅茶) = 18/28 = 9/14 ≒ 0.643

(1)と(2)は別の答えになります。条件と事象を取り違えないのが条件付確率の基本です。

問題 7 ─ 乗法定理【6-4】

ある工場で作られた製品の不良率は8%です。検査員がこの製品を検査するとき、不良品を正しく不良品と判定する確率は92%です。良品を誤って不良品と判定してしまう確率は3%です。

製品が不良品で、かつ検査員が不良品と判定する確率を求めてください。

解答を見る

事象A = 不良品、事象B = 検査で不良判定、とします。

  • P(A) = 0.08(不良率)
  • P(B|A) = 0.92(不良品を不良と判定する確率:これが条件付確率)

求めるのは「不良かつ不良判定」、つまり P(A∩B)。乗法定理を使います。

P(A∩B) = P(A) × P(B|A) = 0.08 × 0.92 = 0.0736(7.36%)

全製品のうち約7.4%が「真の不良品で、かつ検査でも不良と判定された」ことになります。

問題 8 ─ ベイズの定理【6-5】

問題7と同じ条件です。すなわち:

検査員がある製品を「不良品」と判定しました。この製品が本当に不良品である確率を求めてください。

解答を見る

ベイズの定理の出番です。1,000個の製品で考えてみましょう。

  • 不良品:1,000 × 0.08 = 80個
  • 良品:1,000 × 0.92 = 920個

それぞれの検査結果:

  • 不良品80個のうち、不良判定:80 × 0.92 = 73.6個
  • 良品920個のうち、不良判定(誤判定):920 × 0.03 = 27.6個
  • 不良判定の合計:73.6 + 27.6 = 101.2個

不良判定された製品のうち、本当に不良品なのは73.6個。

P(不良 | 不良判定) = 73.6 / 101.2 ≒ 0.727(72.7%)

式で書くなら:

P(A|B) = P(A) × P(B|A) ÷ [P(A) × P(B|A) + P(A^c) × P(B|A^c)]
= 0.08 × 0.92 ÷ [0.08 × 0.92 + 0.92 × 0.03]
= 0.0736 ÷ 0.1012 ≒ 0.727

検査の精度(92%)よりも、「本当に不良である確率」は少し低くなります(72.7%)。事前確率(不良率8%)の影響でこうなる──これが6-5で学んだベイズの定理の効果です。

ちなみに、6-5の病気の検査の問題(事前確率1%、検査精度90%)では結果は約15%でした。今回は事前確率が8%とそれよりずっと高いため、結果も72.7%とかなり高くなっています。事前確率が結果を大きく左右することが、2問を比べるとよくわかりますね。

3. 第6章を終えて

8問お疲れさまでした。第6章「確率」を通して学んだことを、最後に俯瞰しておきましょう。

テーマ 身につけた力
6-1事象と確率用語の整理、3つの確率定義、加法定理
6-2練習問題余事象や場合の数を使った計算力
6-3独立性独立と排反の区別、独立試行の掛け算
6-4条件付確率「世界が縮む」感覚、乗法定理
6-5ベイズの定理結果から原因を推測する力
6-6本ページ独立性の落とし穴、章全体の総復習

確率を学んだ意味

確率は、第1〜5章で学んだ記述統計とは違う方向の知識です。「まだ起きていないこと」「不確実なこと」を扱う力。次の第7章で学ぶ確率変数と確率分布の土台になり、その先のデータサイエンス・AI・意思決定の世界へとつながっていきます。

特にベイズの定理が示してくれた「結果から原因を推測する」発想は、現代社会で生き抜くうえでの思考のフレームそのもの。陽性が出ても本当に病気とは限らない、メールの単語だけで完全にスパムとは決められない──こうした「確率的に考える」姿勢は、データを扱うあらゆる場面で武器になります。

CHAPTER 6 完了!

第6章「確率」、ここで完了です。 全6ページ、長い旅でしたね。

この章で学んだ確率の知識は、第7章で扱う確率変数と確率分布の土台になります。「サイコロを振った結果」を変数として扱い、その値がどんなパターンで現れるかを見ていく章。記述統計(第1〜5章)と確率(第6章)が組み合わさって、データの世界がもう一段深く見えてきます。

さえちゃん
さえ

第6章コンプリート、本当におつかれさまでした! 確率は最初難しく感じても、問題を解いた数だけ得意になる分野です。間違えた問題があれば、ぜひ何度も解き直してくださいね!