調和平均について
私が学生時代に全く理解できなかったのが、調和平均です。
中学の数学で先に学び、そのあと理科のオームの法則で「合成抵抗」が出てくるので、そこでも習った内容だと思います。
平均は算術平均(相加平均)、幾何平均(相乗平均)、そして調和平均とあります。この記事では「調和平均」に焦点を当てて、説明していきます。
この記事で学習できること
- 調和平均
以下、まったく理解できなかった過去の自分へのブログです。
調和平均とは?
調和平均は、逆数の平均の逆数を取ることで計算されます。
2つの値、「60」と「100」の値を例にすると、算術平均では「80」になりますが、調和平均では「75」と算出されます。
(60+120)÷ 2 = 80
【逆数の平均】
(1/60 + 1/100)÷ 2
→(1/60 + 1/100)× 1/2
→(1/120 + 1/200)= (5/600 + 3/600) = 8/600
【その逆数】
600/8 = 75
どうして、逆数の平均の逆数なんて面倒くさいことをするのか? この計算式が当時まったくわかりませんでした。
大人になって機械学習を学び、ようやく理解に及びました。長かったね。
調和平均の理解の仕方
わかりやすさを追求した説明でいうと、以下のとおりです。
100点満点中、60点を合格基準としたテストA(難易度:高)があります。そして、100点満点を合格基準としたテストB(難易度:低)があります。
この2つの試験を1回にまとめて行わなければならなくなったとき、設定するべき合格基準ラインは何点にするべきでしょうか? 2つの平均の80点にするべきでしょうか? それとも、調和平均の75点にするべきでしょうか?
この場合、調和平均の75点のほうが受験生にとっては嬉しいですよね。
難しい試験と易しい試験の1点を、同じ1点と見做して扱うのはよくない。つまり、条件の異なる2つの算術平均に対して「補正」を入れてあげたのが、調和平均です。
では、どのような補正か?
逆数にすると、小さな値は大きな値になり、大きな値は小さな値になります。数字の力を入れ替えて平均を出し、元に戻してあげた。この作業が「補正」です。
もうひとつ、往路・復路の自動車移動の例を出してみましょう。
例えば、往路を時速60キロメートル、復路を時速100キロメートルで10キロメートル走った場合の平均時速は、調和平均により75キロメートル/時と計算されます。
これも、行きと帰りでは状況が異なるので、直線道路を20キロ進んだ平均速度80キロと同一の速度である、とイコール関係を結ぶのはちょっと無理がありますからね。
この往復速度も、調和平均によって「補正」を入れるべき事象なのです。このように考えると、調和平均の使いどころがわかりやすくなりませんか?
Excelでの調和平均を求める関数
Excelでは、HARMEAN(ハーミーン)関数で求められます。覚えておいて損はないです。
まとめ
補正の入った調和平均は、相加平均よりもマイナスの値で出力されます。
統計学では調和平均を使うシーンはあまりないのですが、この調和平均の記事を探している方のほとんどは、機械学習、またはG検定・データサイエンティスト検定の合格を目指している方だと想定しています。
調和平均は絶対に出題されますからね。調和平均の理解がないと、絶対に精度の評価をする際に扱うF1スコアを理解できないので、この記事で納得していただけると嬉しいです。
以上、調和平均についての記事でした。ここまでのご一読ありがとうございました。そして過去の自分を克服できたこの瞬間、自分にありがとうで締めくくりたいと思います。
次はトリム平均を学習していきましょう。