2元配置分散分析 — 主効果と交互作用
前回(5-8)の1元配置は、群分けの要因が1つでした。今回は要因を2つに増やします。たとえば「肥料の種類(要因A)」と「作物の品種(要因B)」を同時に変えて収穫量を比べる、といった場面です。要因が2つになると、それぞれ単独の効果(主効果)だけでなく、交互作用という新しい登場人物が現れます。
交互作用とは「一方の要因の効き方が、もう一方の水準によって変わる」こと。これを平行か非平行かのグラフでつかむのが本ページの山場です。総変動を要因A+要因B+交互作用A×B+誤差の4つに分け、それぞれの平方和・自由度・平均平方・$F$ を求めて分散分析表を読み取ります。1元配置の分解が、もう一段細かくなるだけです。
2元配置のキーワードは交互作用! たとえば「この肥料は品種Xにはすごく効くけど、品種Yには効かない」みたいな相性のこと。要因AとBが互いに影響し合うんだね。主効果=それぞれ単独の効果、交互作用=組み合わせの効果。グラフが平行なら交互作用なし、交差したり開いたりしてたらあり! ここを目でつかもう。
1. 2つの要因を同時に調べる
1元配置では1つの要因(たとえば肥料)だけを動かしました。でも現実には、収穫量は肥料と品種の両方で変わります。要因ごとに別々の1元配置を2回やる手もありますが、それより2つを同時に1つの分析にのせるほうが、データを効率よく使えて、しかも次に説明する交互作用まで調べられます。
用語を決めます。動かす要因を要因A・要因B、各要因が取る条件を水準と呼びます。要因Aが $a$ 水準、要因Bが $b$ 水準あるとき、その組み合わせ(セル)は $a\times b$ 通り。各セルで観測値を $r$ 個ずつ取る設計を繰り返しのある2元配置といいます。繰り返し($r\ge 2$)があってはじめて交互作用と誤差を分けて測れるので、本ページは繰り返しありを前提にします。
2元配置で調べたい問いは3つです。(1) 要因Aの主効果:Aの水準を変えると平均が変わるか。(2) 要因Bの主効果:Bの水準を変えると平均が変わるか。(3) 交互作用A×B:AとBの組み合わせ方で、効き方が変わるか。これら3つを、それぞれ別々の $F$ 検定で判定します。
2. 主効果と交互作用 ─ 平行か非平行か
主効果は素直です。要因Aの主効果は「Bを無視してAの水準ごとに平均を出したとき、その平均が水準で違うか」。要因Bの主効果も同様です。難しいのは交互作用。これは「要因Aの効果の大きさが、要因Bのどの水準にいるかで変わってしまう」という現象です。
言葉だけだとつかみにくいので、セルごとの平均をグラフにします。横軸に要因Aの水準、折れ線を要因Bの水準ごとに引きます。このとき線が平行なら交互作用なし、平行でなければ交互作用ありです。
セル平均のグラフ。左:2本の線が平行=Aの効果がBの水準によらず一定(交互作用なし)。右:線が交差・非平行=Aの効果がBの水準で変わる(交互作用あり)
平行ならば「Aを A1→A2 に変えたときの上がり幅が、B1でもB2でも同じ」。だからAの効果はBに左右されず、両者は足し算で効きます。非平行ならば、その上がり幅がBの水準で変わる──これが交互作用です。交互作用が強いと、主効果だけ見ても全体像を読み違えます(「平均すれば効果なし、でも品種ごとに見ると正反対」のような状況が起こる)。
3. 変動の分解 ─ 4つに分ける
1元配置では総変動を「群間+群内」の2つに分けました。2元配置(繰り返しあり)では、群間にあたる部分がさらに要因A・要因B・交互作用A×Bの3つへ細分され、群内にあたる部分が誤差になります。全部で4つです。
総変動 $SST$ が次のように分解されます。 $$SST = SS_A + SS_B + SS_{A\times B} + SS_E$$ 記号を整理すると(総平均 $\bar{x}$、要因Aの水準 $i$ の平均 $\bar{x}_{A_i}$、要因Bの水準 $j$ の平均 $\bar{x}_{B_j}$、セル $(i,j)$ の平均 $\bar{x}_{ij}$)、 $$ \begin{aligned} SS_A &= b\,r\sum_{i}(\bar{x}_{A_i}-\bar{x})^2 \quad\text{(要因Aの主効果)}\\[2pt] SS_B &= a\,r\sum_{j}(\bar{x}_{B_j}-\bar{x})^2 \quad\text{(要因Bの主効果)}\\[2pt] SS_{A\times B} &= r\sum_{i}\sum_{j}(\bar{x}_{ij}-\bar{x}_{A_i}-\bar{x}_{B_j}+\bar{x})^2 \quad\text{(交互作用)}\\[2pt] SS_E &= \sum_{i}\sum_{j}\sum_{l}(x_{ijl}-\bar{x}_{ij})^2 \quad\text{(誤差)} \end{aligned} $$
交互作用の式 $\bar{x}_{ij}-\bar{x}_{A_i}-\bar{x}_{B_j}+\bar{x}$ は少し複雑ですが、意味は明快です。「セル平均が、もし主効果だけの足し算で説明できるなら、この値はゼロになる」のです。つまり、足し算では説明しきれないズレこそが交互作用。グラフが非平行になる量を、数式で取り出していると考えてください。
4. 自由度・平均平方・F値と分散分析表
各平方和を自由度で割って平均平方(MS)に直し、それぞれを誤差の平均平方 $MS_E$ で割って $F$ を作ります。要因A・要因B・交互作用、それぞれに別々の $F$ 値が出る点が1元配置との大きな違いです。
自由度は、要因Aが $a-1$、要因Bが $b-1$、交互作用が $(a-1)(b-1)$、誤差が $ab(r-1)$、全体が $abr-1$。各 $F$ は $$F_A = \frac{MS_A}{MS_E},\quad F_B = \frac{MS_B}{MS_E},\quad F_{A\times B} = \frac{MS_{A\times B}}{MS_E}$$ いずれも、対応する自由度と誤差自由度 $ab(r-1)$ の $F$ 分布で、上側だけを見て判定します。
どの $F$ も分母は共通して $MS_E$(誤差の平均平方)です。誤差=偶然のばらつきを物差しにして、各要因や交互作用がそれより明らかに大きいかを見る、という発想は1元配置とまったく同じ。物差し(分母)を共有して3つの問いを同時に検定しているわけです。
| 変動要因 | 平方和 SS | 自由度 df | 平均平方 MS | F 値 |
|---|---|---|---|---|
| 要因A | $SS_A$ | $a-1$ | $MS_A$ | $MS_A/MS_E$ |
| 要因B | $SS_B$ | $b-1$ | $MS_B$ | $MS_B/MS_E$ |
| 交互作用 A×B | $SS_{A\times B}$ | $(a-1)(b-1)$ | $MS_{A\times B}$ | $MS_{A\times B}/MS_E$ |
| 誤差 | $SS_E$ | $ab(r-1)$ | $MS_E$ | — |
| 全体 | $SST$ | $abr-1$ | — | — |
ここでも自由度は縦に足すと全体に一致します:$(a-1)+(b-1)+(a-1)(b-1)+ab(r-1)=abr-1$。表の検算には、平方和の縦の和が $SST$、自由度の縦の和が $abr-1$ になるかをまず確かめましょう。
表を読む順番にコツがあるよ。まず交互作用 A×B から見るの! もし交互作用が有意なら、主効果だけを単独で語るのは危険。「Aの効果はBの水準しだい」だからね。交互作用がなければ、AとBの主効果をそれぞれ素直に解釈すればOK。交互作用ファースト、覚えておいてね。
5. 数値例:2×2の繰り返しあり
要因A(2水準 $a_1, a_2$)、要因B(2水準 $b_1, b_2$)、各セル $r=3$ 回ずつ繰り返した収穫量です。$a=2,\ b=2,\ r=3$、総数 $abr=12$。有意水準 $\alpha=0.05$ で、A・B・交互作用の3つを検定します。
データとセル平均 $\bar{x}_{ij}$ は次のとおりです。
| $b_1$ | $b_2$ | Aの水準平均 $\bar{x}_{A_i}$ | |
|---|---|---|---|
| $a_1$ | $10,12,11$(平均 $11$) | $18,20,19$(平均 $19$) | $15$ |
| $a_2$ | $14,16,15$(平均 $15$) | $16,18,17$(平均 $17$) | $16$ |
| Bの水準平均 $\bar{x}_{B_j}$ | $13$ | $18$ | 総平均 $\bar{x}=15.5$ |
各平方和を順に計算します。まず主効果。$br=2\times3=6$、$ar=2\times3=6$ を使います。 $$ \begin{aligned} SS_A &= br\sum_i(\bar{x}_{A_i}-\bar{x})^2 = 6\big[(15-15.5)^2+(16-15.5)^2\big] = 6(0.25+0.25)=3 \\[2pt] SS_B &= ar\sum_j(\bar{x}_{B_j}-\bar{x})^2 = 6\big[(13-15.5)^2+(18-15.5)^2\big] = 6(6.25+6.25)=75 \end{aligned} $$ 交互作用は、各セルで $\bar{x}_{ij}-\bar{x}_{A_i}-\bar{x}_{B_j}+\bar{x}$ を求めて二乗し、$r=3$ 倍します。たとえばセル $(a_1,b_1)$ は $11-15-13+15.5=-1.5$。4セルすべて $\pm1.5$ になり、 $$SS_{A\times B} = r\sum_i\sum_j(\cdots)^2 = 3\big[(-1.5)^2+(1.5)^2+(1.5)^2+(-1.5)^2\big] = 3\times 9 = 27$$ 誤差は各点とそのセル平均の差の二乗和です。各セルで $(-1)^2+1^2+0^2=2$ ずつ、4セルで $$SS_E = \sum\sum\sum(x_{ijl}-\bar{x}_{ij})^2 = 2+2+2+2 = 8$$ 総変動は $SST = 3+75+27+8 = 113$(全点の $\sum(x-15.5)^2$ を直接計算しても $113$)。
自由度は $a-1=1$、$b-1=1$、$(a-1)(b-1)=1$、誤差 $ab(r-1)=4\times2=8$、全体 $abr-1=11$。分散分析表は次のとおりです。
| 変動要因 | SS | df | MS | F |
|---|---|---|---|---|
| 要因A | $3$ | $1$ | $3$ | $3.0$ |
| 要因B | $75$ | $1$ | $75$ | $75.0$ |
| 交互作用 A×B | $27$ | $1$ | $27$ | $27.0$ |
| 誤差 | $8$ | $8$ | $1$ | — |
| 全体 | $113$ | $11$ | — | — |
$MS_E = 8/8 = 1$ が共通の分母です。上側 $5\%$ 点は $F_{0.05}(1,8)\approx 5.32$。これと各 $F$ を比べます。
- 交互作用:$F=27.0 > 5.32$ → 有意($p\approx 0.0008$)。AとBの組み合わせで効き方が変わる
- 要因B:$F=75.0 > 5.32$ → 有意($p\approx 0.00002$)。Bの主効果あり
- 要因A:$F=3.0 < 5.32$ → 有意でない($p\approx 0.12$)。Aの主効果は認められない
交互作用ファーストで読むと、まず交互作用が有意なので「Aの効果はBの水準しだい」。実際 $b_1$ では $a_1\,(11)\to a_2\,(15)$ と上がるのに、$b_2$ では $a_1\,(19)\to a_2\,(17)$ と下がっています。要因A単独の主効果が有意でないのは、この逆向きの効果が平均で打ち消し合ったためで、「Aは無関係」と早合点してはいけない好例です。
6. 結論と使いどころ
2元配置分散分析の骨格は、1元配置と同じ「変動を分解して、$MS$ の比=$F$ で判定」です。違いは、群間にあたる部分を要因A・要因B・交互作用の3つに割り、それぞれを共通の $MS_E$ で割って3つの $F$ を作る点だけ。表の読み取りでは、自由度の足し算による検算と、交互作用ファーストの解釈を徹底しましょう。
試験では分散分析表の空欄補充と、「交互作用が有意かどうか」の判断が頻出です。流れは──(1) 自由度を $a,b,r$ から埋める、(2) $MS=SS/df$ を計算、(3) 各 $F=MS/MS_E$ を出す、(4) 交互作用 → 主効果の順に上側 $F$ 点と比べる。グラフが与えられたら、平行か非平行かで交互作用の有無を目視確認できます。
まとめ
第5章 5-9、ポイントを整理します。
- 2元配置:要因A($a$ 水準)・要因B($b$ 水準)を同時に調べる。各セル $r$ 回の繰り返しで交互作用と誤差を分離
- 主効果と交互作用:主効果=各要因単独の効果、交互作用=一方の効果が他方の水準で変わること。セル平均のグラフが平行なら交互作用なし、非平行ならあり
- 変動の分解:$SST = SS_A + SS_B + SS_{A\times B} + SS_E$
- 自由度:$a-1,\ b-1,\ (a-1)(b-1),\ ab(r-1)$。縦に足すと $abr-1$
- F値:$F_A,\ F_B,\ F_{A\times B}$ はすべて分母が共通の $MS_E$。上側だけで判定
- 読む順:交互作用ファースト。有意なら主効果の単独解釈は要注意
これで第5章 線形モデル分析は一区切りです。次回 6-1 正規Q-Qプロット からは第6章。データが正規分布にどれだけ近いかを目で確かめる方法から、適合度・独立性の $\chi^2$ 検定へと進みます。分散分析で活躍した「ズレを二乗して足す」発想が、また形を変えて登場しますよ。
2元配置、おつかれさま! 「総変動を A・B・交互作用・誤差の4つに分ける」「分母はぜんぶ $MS_E$」「読むときは交互作用ファースト」──この3つを押さえれば大丈夫。グラフが非平行=交互作用ありも、目でパッと見抜けるようにしておこう。次は第6章、正規Q-Qプロットからだよ!