こんにちは! Excel講師の榊裕次郎です。

平均には「算術平均」「幾何平均」「調和平均」「トリム平均」…… と、単語を並べればたくさんの平均が存在します。

また、「算術平均」を「相加平均」とも呼んだりするので、平均を勉強しようとすると、たくさんの平均値が存在するような錯覚に陥ります。

この記事では、それぞれの平均についてまとめました。

  1. 算術平均(相加平均)
  2. 幾何平均(相乗平均)
  3. 調和平均
  4. トリム平均(調整平均・刈り取り平均)
  5. 加重平均
  6. 移動平均

単純に「平均」とだけ言えば、一般的に「算術平均」のことを指しますので、まずは一番オーソドックスな「算術平均」から解説していきましょう。

(※ 表示速度重視のAMPページのため、目次機能を使用できずに申し訳ございません……)

1. 算術平均(相加平均)とは

算術(さんじゅつ)平均、または相加(そうか)平均ともいいます。

対象となる数値データの合計値から、データの個数で割った値のことです。

Excelでは、AVERAGE(アベレージ)関数で簡単に出力ができますよね。

10時から16時まで、1時間おきの来場者数を集計し、1時間単位の平均来場者数を割り出しました。

時間区分は7つあるので、累計来場者数の「13,072」を「7」で割った値が「1,867」となり、この数値が1時間あたりの平均来場者数となります。

このように、算術平均は合計値を個数で割った単純な値です。

実際のイベント業務では、前回の時間別来場者数(最大)・1時間あたりの平均来場者数・時間別来場者数(最低)の3つを事前把握して、人員配備の最適化を行ったりしています。

ただし、算術平均は単純な計算ゆえに、しっくりこない値を出力してしまう危険性を含んでいます。


例えば、10人で飲み会を開催したとしましょう。

そのグループのうち3人がドカ食い、ドカ飲みをしてしまったとします。

お会計は70,000円となってしまいました。

この金額の平均値を求めるため、合計から飲み会の参加人数で割り算をします。

つまりは「割り勘」です。

そうすると、1人7,000円の支払いで済みますが、あまり飲食をしていなかった人からすれば、どうして7,000円も払わなきゃいけないんだ! と、幹事に文句を言いたくなりますよね。

逆に、同じ10人の飲み会で、3人が仕事で遅れて参加した場合、駆け付け1杯のビールを飲み干しただけで予約した席の時間が終了、そのままお開きになってしまったとします。

お会計は50,000円。

このときも同じように割り勘をしたら、残り7人は得をした気分になりますが、3人はビール1杯5,000円となってしまいますので、遅刻した人は散々な目に遭うこととなります。

このように、算術平均は使いどころを間違えると理不尽な割り勘に相当しますので、しっくりこない値を生んでいないかどうか、必ず気を付けてください。

2. 幾何平均(相乗平均)とは

幾何(きか)平均、または相乗(そうじょう)平均ともいいます。

私自身は前者の言葉が好きなので、この記事では幾何平均を採用したいと思います。

この平均は、比率や割合の平均を出すシーンに用いられます。

説明するよりも、データをご覧いただいた方が早いので、以下のワークシートをゆっくり読み解いてみてください。

いかがでしょうか?

幾何平均は、ExcelではGEOMEAN(ジオミーン)関数で求めることができます。

左の売上表を見ると、4年目と5年目は特に乱高下がありますが、気づいた人は計算ができる人です。

これは、開始地点と最終地点しか見ていないんですね。

幾何平均は、終わり良ければすべてよし。

スタート地点から何%ずつ、ペースよく業績を上げてきたか? 計算自体はなんとなくずるい気もしますが、最終報告を簡素化して伝えることができる魔法の平均値です。

そのため、終わりがよくないと幾何平均はあっさりとマイナス評価となってしまいます。

事例として、銀行に融資をお願いしたり、事業継続のための補助金を申請する際には、業績説明の際に幾何平均を用いて、数字を簡素化して業績の状況を伝えることができるでしょう。

しかし、このサンプルデータは極端な例でもありますが、実際のデータにおける+の年、-の年の説明をしっかりできないと、信頼性に欠ける表となってしまいます。

この幾何平均を扱う場合は、黒く塗りつぶしてある途中経過に表示された数字をしっかりと説明できるよう、事前準備が重要となります。

ごまかしは必ずバレてしまいますからね。

3. 調和平均とは

調和(ちょうわ)平均は、一般的な業務で使う機会はほとんどないので、読み飛ばしていただいても構いません。

私自身も実際の仕事でこの平均を求めたことはありません。

この平均は、私立中学校の受験問題で出てくるような以下の問題文で理解していきましょう。


問題

車で、時速100キロを出して、100キロ先の目的地まで移動しました。かかった時間は60分です。そして、帰りは時速60キロで、100キロ先の出発地に戻りました。かかった時間は100分です。

往復の平均速度は何キロになるでしょうか?


この場合、速度のみフォーカスをあてて算術平均で求めてしまうと、平均速度は時速80キロで往復したよね! ということになってしまいますが、正解は時速75キロになります。

こちらもExcelの表をご覧いただければ早いかと思うので、読み解いてみてください。

いかがでしたでしょうか?

Excelでは「HARMEAN(ハーミーン)関数」を使います。

調和(ハーモニー)の平均(ミーン)で、ハーミーン関数というわけですね。

なんとなく聞き心地のよい関数でもあります。

往復の距離は200キロです。

往復した移動時間は160分となります。

速度を求める公式に当てはめて解いてみると、

200(km)÷ (160 ÷ 60) = 74.99 ≒ 75km

75キロで往復した結果となります。

単純に速度を平均してしまうと、正しい結果を求めることができません。

80キロで往復した場合で、確認をしてみましょう。

時速80キロでは、200キロの移動時間は150分となるため、計算が合わなくなります。

これって、なかなか難しいですよね。

4. トリム平均(調整平均 or 刈り込み平均)とは

トリム平均は呼び名がいろいろあり、調整(ちょうせい)平均や刈り込み(かりこみ)平均とも呼ばれています。

SUMIFS関数をどう読むかと一緒で、別になんだって構いません。

ここではトリム平均という呼び方で行きましょう。

この「トリム」をアルファベットで書くと「trim」となります。

翻訳サイトで調べてみると、「刈り込む」、「刈る」という意味で出てきます。

つまり、トリム平均とは「データの一部を刈り取ってから算術平均で求める」というテクニックを使った平均です。

例えば、コンビニエンスストアで来店客の滞在時間を調べた事例を使ってみましょう。

調査対象となる被験者は1,000人。

被験者となったおおかたの来店客の滞在時間は90秒前後であることに対し、来店客の一部には、商品を選んでいるうちにお腹がすごく痛くなってしまったとします。

トイレに駆け込み、しばらく出てこなくて、その調査対象者の滞在時間が1000秒や2000秒のかけ離れたデータが混じってしまったケースです。

また、入店したけれども急に電話がかかってきて、すぐに退店してしまった人や、お財布を忘れたことに気づいてすぐに出ていった人もいるとしましょう。

これらの予期しない被験者がいることで、全体から滞在時間の平均値を出そうとしても、イレギュラーな結果になる滞在時間によって、本来の平均値を大きく揺さぶらされてしまいます。

極端に大きな数値、または極端に小さな数値を平均の中に含めることは、算術平均でも紹介したしっくりこない値を導き出してしまいかねないので、その部分は「刈り取る」必要性が出てくるわけですね。

そのため、このトイレに長居したお客と、すぐに帰ってしまったお客を取り除いて平均を出したほうが、本当の滞在時間の平均が求まりそうです。

ExcelではTRIMMEAN(トリムミーン)関数で求めることができます。

全体のデータを昇順に並び替え、上位5%、下位5%のデータを取り除いて平均を求めます。

この場合の平均を、5%トリム平均、といった言い方をします。

AVERAGE関数で求めた平均と、TRIMMEAN関数で求めた平均を比べてみてください。14秒もの差がでていますよね。

異常値を刈り取る平均が、トリム平均でした。

重要なのは、どれだけ刈り取るか? によって算出される平均値は異なりますので、刈り取るサイズをうまく決める必要があります。

はじめて刈り取る人はいつだって不安な顔をするのですが、考えすぎると作業も進みません。

初めて使用する場合は、データを全体的に俯瞰し、5%、10%と刈り取ったトリム平均を見て、だいたいこれくらいだなと直感で見極めてください。

さて、この一例ではトイレに長居した人、すぐに帰った人、という事例で解説しました。

1点だけ補足ですが、TRIMMEAN関数を使う場合は、以下のように、第2引数に5%と設定すると、必ず上位5%、下位5%、両方を刈り取って、残った値で算術平均で求めた結果となります。

異常値を手動で除去できれば、単純にデータから取り除いてAVERAGE関数を使えばいいだけの話なので、わざわざTRIMMEAN関数を使う必要はありません。

データ件数が多く、手動ではどうにもならないときにTRIMMEAN関数をお使いください。

以上、補足でした。

5. 加重平均とは

加重(かじゅう)平均とは、その名のとおり、平均に重みを加えることを指します。

重み、といっても、なんの重みかはわかりませんよね。

例を出しましょう。

喫茶店でコーヒー、紅茶、ココアの3商品があるとします。

コーヒーは450円、紅茶は500円、ココアは550円となり、それぞれ値段は異なります。

値段だけ見れば、平均販売価格は500円だ! と、暗算でもわかってしまいますが、これは単価の数字を平均した結果であって、それぞれどれだけ販売されたか? の情報が消えてしまいます。

ここでいう「重み」とは、オーダー数のことを指すので、どれだけ注文してくれたかの情報(重み)も、単価の平均に(加えて)算出しよう! ということです。

この場合のオーダー数のデータを「ウエイト値」といいます。

実際にコーヒーが25杯、紅茶が12杯、ココアが16杯売れたとしましょう。

このお店の1顧客単価はどれくらいか? という分析をしたいときに使えるのが加重平均です。

各3商品の売上合計から、オーダー数の合計を割って単価を求めます。

小数点の端数が消えていため「492」を「53」で掛け算しても「26,076」で「26,050」にはなりませんが、近い値にはなりますよね。

関数は、SUMPRODUCT関数を使えば、わざわざ各合計を出さなくても済みます。

以上が加重平均でした。

この加重平均は、最低でも1日あと●人多く呼び込まないといけないのか!? みたいな指標を立てるときに、大いに役に立つでしょう。 

単価を安易に算術平均で求めがちになるので、平均の出し方に注意してください。

6. 移動平均とは

新型コロナウイルスが世に出てきてから、今日の感染者数を毎日のニュース番組で見聞きされていると思います。

そのため、この移動平均という言葉はもう聞きなれているものかもしれません。

まずは、移動平均の求め方を先にご覧ください。

移動平均は、基本的に算術平均ですが、使い方のテクニックがあります。

新型コロナウイルス陽性者推移を見る場合、このように7日平均で発表されることが多いです

オートフィルをすると、相対参照で1セルずつ範囲が移動していくため、2021/9/8 の感染者数7日平均値は「2,043」となります。

グラフにしてみましょう。

移動平均の値は、折れ線グラフで確認します。

定まった期間内の平均値を並べてグラフ化することで、データの波形をなだらかにして現状を把握することができる、というわけです。

現在の感染者数が上昇傾向にあるのか、下降傾向にあるのか、一目瞭然ですね。

移動平均は7日、25日、月単位といろいろと取り方は様々なので、目的に応じて期間を定めた平均値を取ってください。

感染者数などは7日平均がわかりやすく、株価などは25日平均が使われています。

売上データに関しては月平均で業績を見たりしますが、売上データも日別月別などがあるので、どの区間がわかりやすいかは模索する必要がありますね。

まとめ

以上が、Excel講師が教える「いろんな平均」講座の記事でした。

平均といっても本当にいろいろあり、算術平均でも使い方を工夫すればいろいろな平均を出して現状を把握することができます。

ぜひ、平均の正しい知識を身につけて、データを見る力を養ってくださいね。

それではまた!