講座リクエスト受付フォーム
PeachRoom

4つの分析パターン

Yujiro Sakaki

仮説について、p値についてと学習できました。

そして、ここからいよいよ本格的な分析に入っていきます。その前に、統計学の準備段階で扱った「変数」のおさらいをしておきましょう。

変数には 質的変数量的変数 がありました。この2種類の変数を「原因 × 結果」として組み合わせることで、使える分析手法が4つのパターンに分類される のです。

Check Point

この記事で学習できること

  • カイ2乗検定の分析パターン
  • t検定の分析パターン
  • 回帰分析の分析パターン
  • ロジスティック回帰の分析パターン

こちらの記事では、どのパターンのときにどの分析手法を使うのか? 先にざっくり整理しておきます。

この整理が頭の中に入っていると、後の推測統計が一気に理解しやすくなります。

いよいよ推測統計学に入っていきますよ!

原因と結果となる変数の組み合わせ

以前の記事の再掲となります。2種類の変数を「原因」×「結果」と定義して割り当てると、以下の4つの組み合わせが考えられました。

  1. 質的変数 × 質的変数
    • 質的変数同士の関係を調べるケース
    • 性別と新商品案①②③は、それぞれどのような違いがあるか?
  2. 質的変数 × 量的変数
    • 質的変数が原因で量的変数が結果となるケース
    • 各地域によって、平均収入が異なるかどうか?
  3. 量的変数 × 量的変数
    • 量的変数同士の関係を調べるケース
    • 売上と広告費の関係性があるかどうか?
  4. 量的変数 × 質的変数
    • 量的変数が原因で質的変数が結果となるケース
    • スマートフォンの利用時間経過に伴い、購入意欲が出てくるかどうか?

それぞれ、パターン①・②・③・④として説明をしていきます。

① カイ2乗検定

4つの分析の中でも、原因と結果、どちらも質的変数を扱うタイプのパターンです。こちらは カイ2乗検定 を使って分析をしていきます。

質的変数 × 質的変数

  • 質的変数同士の関係を調べるケース
  • 性別と新商品案①②③は、それぞれどのような違いがあるか?

例えば、広告AパターンとBパターンでアクセス数を確かめた際、どちらのほうが効果があったのか? ということを調べる「ABテスト」もこの分析手法です。

詳しくはカイ2乗検定の際にお伝えしますが、割合の差を見る分析手法となります。

ただし、原因も結果も情報量の少ない質的変数を用いるため、結果の読み方は限定的となります。そして何より、このパターンが分析で一番難しいかもしれません。

② t検定

こちらは原因が質的変数で、結果が量的変数となるパターンです。主に平均値を使って差を比べる分析手法となります。

質的変数 × 量的変数

  • 質的変数が原因で量的変数が結果となるケース
  • 各地域によって、平均収入が異なるかどうか?

t検定は、扱うデータによって計算方法が4つも分岐しますので、こちらはExcelを使って解説をしていきますね。

50年近い歴史の中で完成されたt検定。ウィリアム・セーリー・ゴセットさんからスタートした「スチューデントのt検定」より詳しく解説していきます。

    ③ 回帰分析

    売上と広告費のように、「数字 × 数字」の関係を見るときに登場するのが 回帰分析 です。

    量的変数 × 量的変数

    • 量的変数同士の関係を調べるケース
    • 売上と広告費の関係性があるかどうか?

    広告費を増やすと売上はどう変わるのか? 身長が伸びると体重も増えるのか? 気温が上がると売上が伸びるのか? こうした 相関 × 予測 の分野を担当します。

    量的変数は情報量が多いので、具体的な予測ができる分析です。4つのパターンの中でも、一番未来予測がしやすい分析手法となります。

    ④ ロジスティック回帰

    このパターンはExcelでは求めることができない分析手法です。

    量的変数 × 質的変数

    • 量的変数が原因で質的変数が結果となるケース
    • スマートフォンの利用時間経過に伴い、購入意欲が出てくるかどうか?

    Pythonを使って分析の概要をご紹介していきますね。

    陽性か陰性かも実はこの ロジスティック回帰 で判断していきます。0~1までの数値の中で、0.5という閾値(しきいち or いきち)を超えたかどうか? という分析手法です。

    まとめ

    4つの分析パターンは、「原因と結果の変数の組み合わせ」で自動的に決まります。

    • 質×質 → カイ2乗検定
    • 質×量 → t検定
    • 量×量 → 回帰分析
    • 量×質 → ロジスティック回帰

    このパターンを頭の中に入れておけば、推測統計を迷わず読み進めることができます。おそらく、ロジスティック回帰まで到達したころには、この4つの分類が当たり前のようにできているはずです。

    以上、導入でした。

    ここからが統計の本質に入っていきます! わくわくですね!

    最終確認日:2025年11月22日

    Advertisement

    メールアドレスが公開されることはありません。 が付いている欄は必須項目です

    このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

    ABOUT ME
    榊 裕次郎
    榊 裕次郎
    Excel講師
    1981年10月生まれのてんびん座、東京都出身。趣味は、旅行と料理とワイン。2025年もラストスパートですね! 皆さんはどんな1年でしたでしょうか?

    2025年が最後までいい1年でありますように、がんばっていきましょう!
    記事URLをコピーしました