第6章 6-6 / 確率

独立性に関する注意と第6章総復習

このページで学ぶこと

第6章のラストです。前半で独立性を扱うときの注意点を簡潔に整理し、後半は第6章の総復習問題8問で章全体の知識を一気に振り返ります。確率は問題を解いてこそ身につく分野。最後の総仕上げ、しっかり手を動かしていきましょう。

さえ

第6章ラスト！　説明はサクッと、問題でしっかり総復習しよう！　間違えても気にしなくて大丈夫。「どこでつまずいたか」がわかることが、何よりの収穫だよ！

1. 独立性を扱うときの注意点

独立性は確率論の中心的な概念ですが、いくつかの陥りやすい落とし穴があります。試験対策としても、実務でデータを扱うときの心がけとしても、ここで簡潔に押さえておきましょう。

注意1：「排反」と「独立」を混同しない

これは6-3で詳しく扱ったポイントですが、もう一度確認しておきます。

排反：同時に起こらない（P(A∩B) = 0）
独立：互いの確率に影響しない（P(A∩B) = P(A) × P(B)）

この2つはまったく別の概念です。むしろ排反な事象は、ほとんどの場合「独立ではない」のでした（Aが起こるとBは絶対起こらないという、強い情報になるため）。

注意2：「独立っぽい」と「独立」は別物

実際のデータを扱うときに気をつけたいのが、「直感的に独立だろう」と決めつけることです。

「身長と血液型」は独立っぽいけど、本当に独立？（実は微妙な関係があるかも）
「コイン投げが連続で表」のとき、次も独立だと感じられるか？（直感は「そろそろ裏が出る」と思いがち）

確率論で「独立」と言ったら、それは数式 P(A∩B) = P(A) × P(B) が成り立つという意味。直感的な「無関係っぽい」とは厳密には別物です。試験では「独立とする」と問題文に明記されていることが多いので、その指示に従って計算しましょう。

注意3：3つ以上の事象の独立性

事象が3つ以上ある場合の独立性は少し複雑です。3級の試験ではあまり深入りしませんが、「全体が独立」であるためには「すべての組み合わせで独立」である必要があるとだけ覚えておけば十分です。

たとえば事象A, B, Cが完全に独立というには、P(A∩B) = P(A)×P(B)、P(B∩C) = P(B)×P(C)、P(A∩C) = P(A)×P(C)、そして P(A∩B∩C) = P(A)×P(B)×P(C) のすべてが成り立つ必要があります。直感的には「2つずつ独立なら全体も独立」と思いがちですが、それだけでは不十分な場合がある──これが3級レベルを少し超える内容です。

POINT

実務でデータを扱うときは、「これは本当に独立？」と一度立ち止まる習慣が大切です。安易に「独立だから掛け算」と進めると、間違った確率を計算してしまうことがあります。

2. 第6章の知識を総ざらい

ここから第6章の総復習問題に入ります。出題範囲は、6-1から6-5までの全範囲。難度は基礎 → 標準 → 応用と段階的に上げています。

必ず手を動かして書き出してから解答を見るようにしてください。間違えた問題こそ宝物。「どこでつまずいたか」を確認することで、苦手な部分が浮き彫りになります。

問題 1 ─ 事象の関係を判定する【6-1】

サイコロを1回振る試行で、A=「3以下」、B=「偶数」とします。次の問いに答えてください。

(1) A∪B、A∩B、A^c をそれぞれ集合で表してください
(2) AとBは排反でしょうか

解答を見る

A = {1, 2, 3}、B = {2, 4, 6} です。

(1)

A∪B = {1, 2, 3, 4, 6}（A、Bのいずれかに含まれる）
A∩B = {2}（両方に共通する）
A^c = {4, 5, 6}（Aに含まれない）

(2)　A∩B = {2} ≠ ∅ なので、AとBは排反ではありません。「2」が両方に含まれているからですね。

問題 2 ─ 加法定理【6-1, 6-2】

ジョーカーを除いた52枚のトランプから1枚引くとき、その1枚が「スペードまたはエース（A）」である確率を求めてください。

解答を見る

事象S = スペード、事象E = エース、とします。

P(S) = 13/52 = 1/4
P(E) = 4/52 = 1/13
P(S∩E) = 1/52（スペードのエース1枚）

加法定理より、

P(S∪E) = P(S) + P(E) − P(S∩E) = 13/52 + 4/52 − 1/52 = 16/52 = 4/13

スペース13枚＋エース4枚で17枚と思いがちですが、「スペードのエース」が両方に含まれているので1枚引いて16枚。これが加法定理の本質です。

問題 3 ─ 余事象を使う【6-2】

コインを5回連続で投げるとき、少なくとも1回は表が出る確率を求めてください。

解答を見る

「少なくとも1回は表」の余事象は「5回とも裏」です。各回が独立な試行なので、

P(5回とも裏) = (1/2)⁵ = 1/32

したがって、求める確率は

P(少なくとも1回は表) = 1 − 1/32 = 31/32

「少なくとも〜」ときたら反射的に余事象。第6章で繰り返し出てきたパターンですね。

問題 4 ─ 独立な試行【6-3】

サイコロを3回振るとき、3回とも6が出る確率と、1回も6が出ない確率をそれぞれ求めてください。

解答を見る

サイコロの各回の試行は独立なので、確率の掛け算が使えます。

3回とも6が出る確率

各回で6が出る確率は 1/6。3回独立なので、

P(3回とも6) = 1/6 × 1/6 × 1/6 = 1/216 ≒ 0.00463

1回も6が出ない確率

各回で6以外が出る確率は 5/6。3回独立なので、

P(1回も6が出ない) = 5/6 × 5/6 × 5/6 = 125/216 ≒ 0.579

サイコロを3回振っても、6が1回も出ない確率は約58%。意外と多いことに気づきます。

問題 5 ─ 復元と非復元の比較【6-3, 6-4】

袋に当たりくじ3本、外れくじ7本（合計10本）が入っています。次の2つの場合について、2回連続で当たりを引く確率をそれぞれ求めてください。

(1) 1回目を戻してから2回目を引く（復元抽出）
(2) 1回目を戻さずに2回目を引く（非復元抽出）

解答を見る

(1) 復元抽出

袋の中身は変わらないので、各試行は独立。

P(両方当たり) = 3/10 × 3/10 = 9/100 = 0.09

(2) 非復元抽出

1回目で当たりを引いた後、袋には当たり2本・外れ7本（合計9本）が残ります。条件付確率と乗法定理を組み合わせて、

P(1回目当たり) = 3/10
P(2回目当たり|1回目当たり) = 2/9

P(両方当たり) = 3/10 × 2/9 = 6/90 = 1/15 ≒ 0.067

復元なら9%、非復元なら約6.7%。「戻すかどうか」だけで確率が変わります。

問題 6 ─ 条件付確率（クロス集計から）【6-4】

ある会社の60人の社員に、好きな飲み物（コーヒー or 紅茶）を聞いたところ、次のような結果になりました。

	コーヒー	紅茶	合計
男性	20	10	30
女性	12	18	30
合計	32	28	60

(1) 1人を無作為に選んだとき、その人が女性で紅茶好きの確率
(2) 紅茶が好きとわかったとき、その人が女性である確率

解答を見る

(1) 女性かつ紅茶好きの確率

全60人のうち、女性で紅茶好きは18人。

P(女性∩紅茶) = 18/60 = 3/10 = 0.30

(2) 紅茶好きとわかったときの女性の確率（条件付確率）

条件は「紅茶好き」、知りたいのは「女性」。紅茶好きに絞った世界で考えます。紅茶好きは合計28人、そのうち女性は18人なので、

P(女性|紅茶) = 18/28 = 9/14 ≒ 0.643

(1)と(2)は別の答えになります。条件と事象を取り違えないのが条件付確率の基本です。

問題 7 ─ 乗法定理【6-4】

ある工場で作られた製品の不良率は8%です。検査員がこの製品を検査するとき、不良品を正しく不良品と判定する確率は92%です。良品を誤って不良品と判定してしまう確率は3%です。

製品が不良品で、かつ検査員が不良品と判定する確率を求めてください。

解答を見る

事象A = 不良品、事象B = 検査で不良判定、とします。

P(A) = 0.08（不良率）
P(B|A) = 0.92（不良品を不良と判定する確率：これが条件付確率）

求めるのは「不良かつ不良判定」、つまり P(A∩B)。乗法定理を使います。

P(A∩B) = P(A) × P(B|A) = 0.08 × 0.92 = 0.0736（7.36%）

全製品のうち約7.4%が「真の不良品で、かつ検査でも不良と判定された」ことになります。

問題 8 ─ ベイズの定理【6-5】

問題7と同じ条件です。すなわち：

製品の不良率：8%
不良品を正しく不良品と判定する確率：92%
良品を誤って不良品と判定する確率：3%

検査員がある製品を「不良品」と判定しました。この製品が本当に不良品である確率を求めてください。

解答を見る

ベイズの定理の出番です。1,000個の製品で考えてみましょう。

不良品：1,000 × 0.08 = 80個
良品：1,000 × 0.92 = 920個

それぞれの検査結果：

不良品80個のうち、不良判定：80 × 0.92 = 73.6個
良品920個のうち、不良判定（誤判定）：920 × 0.03 = 27.6個
不良判定の合計：73.6 + 27.6 = 101.2個

不良判定された製品のうち、本当に不良品なのは73.6個。

P(不良 | 不良判定) = 73.6 / 101.2 ≒ 0.727（72.7%）

式で書くなら：

P(A|B) = P(A) × P(B|A) ÷ [P(A) × P(B|A) + P(A^c) × P(B|A^c)]
= 0.08 × 0.92 ÷ [0.08 × 0.92 + 0.92 × 0.03]
= 0.0736 ÷ 0.1012 ≒ 0.727

検査の精度（92%）よりも、「本当に不良である確率」は少し低くなります（72.7%）。事前確率（不良率8%）の影響でこうなる──これが6-5で学んだベイズの定理の効果です。

ちなみに、6-5の病気の検査の問題（事前確率1%、検査精度90%）では結果は約15%でした。今回は事前確率が8%とそれよりずっと高いため、結果も72.7%とかなり高くなっています。事前確率が結果を大きく左右することが、2問を比べるとよくわかりますね。

3. 第6章を終えて

8問お疲れさまでした。第6章「確率」を通して学んだことを、最後に俯瞰しておきましょう。

節	テーマ	身につけた力
6-1	事象と確率	用語の整理、3つの確率定義、加法定理
6-2	練習問題	余事象や場合の数を使った計算力
6-3	独立性	独立と排反の区別、独立試行の掛け算
6-4	条件付確率	「世界が縮む」感覚、乗法定理
6-5	ベイズの定理	結果から原因を推測する力
6-6	本ページ	独立性の落とし穴、章全体の総復習

確率を学んだ意味

確率は、第1〜5章で学んだ記述統計とは違う方向の知識です。「まだ起きていないこと」「不確実なこと」を扱う力。次の第7章で学ぶ確率変数と確率分布の土台になり、その先のデータサイエンス・AI・意思決定の世界へとつながっていきます。

特にベイズの定理が示してくれた「結果から原因を推測する」発想は、現代社会で生き抜くうえでの思考のフレームそのもの。陽性が出ても本当に病気とは限らない、メールの単語だけで完全にスパムとは決められない──こうした「確率的に考える」姿勢は、データを扱うあらゆる場面で武器になります。

CHAPTER 6 完了！

第6章「確率」、ここで完了です。　全6ページ、長い旅でしたね。

この章で学んだ確率の知識は、第7章で扱う確率変数と確率分布の土台になります。「サイコロを振った結果」を変数として扱い、その値がどんなパターンで現れるかを見ていく章。記述統計(第1〜5章)と確率(第6章)が組み合わさって、データの世界がもう一段深く見えてきます。

さえ

第6章コンプリート、本当におつかれさまでした！　確率は最初難しく感じても、問題を解いた数だけ得意になる分野です。間違えた問題があれば、ぜひ何度も解き直してくださいね！