こんにちは! Excel講師の榊裕次郎です。

こちらの記事では、カイ2乗検定について、初めての人でも1発で理解できるようにわかりやすく記載していきます。

そのため、ここの説明では「カイ2乗分布表」の解説は抜きで説明します。

ここではそういう分布表があるんだ、という前提でご一読ください。

また別の記事で説明しますね。

さて、カイ2乗 は χ² と記載し、ギリシア文字で22番目、英語では「Chi」と表記します。

Excelの関数では、CHISQ (カイスクエア  )〜 の関数を使うので、綴りは覚えておきましょう。

それでは解説していきます!

適合度テスト =カイ2乗検定の使いどころ

なんでも話のスタートは、サイコロが題材となります。

カイ2乗検定とは、適合度テストに扱います。

期待値の話で、サイコロの目を得点とした場合、10,000回振ったときの得点は、1回あたり「3.5点」に収束すると申し上げました。

お時間がございましたら、こちらの記事のあとにご一読いただければ幸いです。

Excel講師が教える「確率変数」×「確率」=「期待値」

さて、ここでもまたサイコロを振って、出た目の数の得点で勝敗を決めたいと思います。

今回は回数を少なくして、10回だけサイコロを振って、勝敗を決めるというケースで考えてみましょう。

以下のような結果が出ました。

なんだか、Bさんのほうが「5」と「6」の目が大きく出ているような気になりますよね。

これは正しい結果かどうか、調べてみましょう。

ここで扱えるのが、適合度テストにふさわしいカイ2乗検定です。

確率変数に「回数」を指定します。

確率変数「10」 × 確率「 1/6」 = 期待値 「1.67」 となります。

10回のうち、それぞれの目が必ず出る期待値は「1.67」回という計算式です。

つまり、最低は1回、よくて2回は出したい目が出るのが普通、といった具合です。

であるなら、Bさんのサイコロの出た目のバランスは、偏りがあるようにも見えます。

Bさんはイカサマをしたのでしょうか?

カイ2乗値の求め方

求め方は、

  1. 期待値を出したら、実測値-期待値で差を出します。
  2. ①の答えをそのまま分散のように2乗します。
  3. 出た答えをすべて合算します。

2乗までは、分散を求めるフローと似ていますね。

最後は1~6までの計算結果を合算して、ここで求まったAさんの「2.00」と、Bさんの「4.40」がχ²値になります。

χ²値 = 適合値 です。

自由度とは?

サイコロを1~6まで振って出る目の値は、全部で6パターンです。

この場合の自由度は「5」になります。

自由度とは、好きな順番に(1,2,3,4,5,6)を並び替えていいよ! といったケースを想定してみてください。

5つ目までは、どの数字を選ぼうかな! という選択ができますが、残った最後の1つの数字は、数字が1つだけになっていまったので、自由に選ぶことができなくなります。

すでに1個しかないので、選択肢がない=最後の1つは自由はない、と定義するんですね。

そのため、全体から1を引いた値の「5」となります。

カイ2乗検定

判断基準は、カイ2乗分布表というものがあります。

冒頭でも記載しましたが、ここでの説明は割愛させてください。

有意水準5%で判別するための、特殊な一覧表だと覚えてください(信頼区間は90%、有意水準は左側右側とあるので、5%×2で10%となります)。

CHISQ.INV(カイスクエア・インバース)関数【左側】と、CHISQ.INV.RT(カイスクエア・インバース・ライトテイルド)関数【右側】で、左側と右側の確率変数を調べてみます。

ここでは右側を使うので、RTのほうを使います。

分布表と、出力されたカイ2乗値を比べてみて、イカサマか偶然の範囲内かを調べることができます。

自由度が5、有意水準が0.05のとき、カイ2乗分布表では、11.07と記載があります。

χ²値=4.40 < 自由度5、有意水準5%の確率変数=11.07

この11.07までは、自然な現象で起きた結果だよ! ということになり、今回のBさんの結果はイカサマではなく、起こりえる事象としてBさんの勝ち! ということが導けます。

統計学的な言い方をすると、

  • 帰無仮説は、サイコロに差はない、という仮説を立てて、
  • 対立仮説には、サイコロに差がある、という仮説を立てます。
  • データによる検証で、χ²値=4.40 < 有意水準5%の確率変数=11.07

ということで、検定結果は、帰無仮説を棄却できず! サイコロに差はない仮説を採択! Bさんのサイコロは偶然の範囲内! と言い切って完了です。

また、イカサマだ! と言えるのは、次のような目の出方ですね。

ここまで偏ると、11.60なので、ちょっとやり直しだ! と言える目の出方となります。

まとめ

いかがでしたでしょうか?

今回は事例をもとに説明すると難しくなるので、まずは簡単なサイコロでのカイ2乗検定の計算方法のみをご説明いたしました。

また別の記事で、カイ2乗分布表についてや、実際の事例を作ってカイ2乗検定をやってみますね。

今回はこれまで、それではまた!