営業マンから見る統計学 〜平均値/中央値編〜

統計学

『統計学は最強の学問である。』という本をちらっと見た事ある方は多いのではないだろうか。 僕は見た事はあるが、読んだ事も手に取った事もない。

理由は、そもそも最強の学問かどうかは、様々な分野の学問にある程度精通している必要があると思っているし、この本を書いている人がその精通している人がどうか、僕では判断できるか微妙な為である。

ただ統計学を感覚値的にでも良いので身につける必要性は、高まってきていると思う。なぜそう思うのか?に関しては、AIやビックデータ、ディープラーニングの分野の発展によるものが大きい。正直、日々の営業活動で統計学が必要になるタイミングは、ほぼないだろう。

  • AI(ビックデータ)と統計学がなぜ、結びつくのか!?
  • 統計学とは、そもそも何なのか!?どのタミングで必要になるのか!?
  • 統計学の詳細について

今回の記事ではこの辺りについて、記載していきたいと思う。                本来なら、上から順を追って説明していくのが筋なのだが、なんとも営業職にはじっと椅子に座っているという事の難易度が非常に高い。ゆえに、今回は『統計学の詳細』について記載したいと思う。この章で少しでも統計学に興味を持ってもらえると嬉しい。

今回、平均値/中央値をテーマにしたのは、想像以上に中央値を知らない人が多かった為である。僕が前職勤めていた会社は、東証一部上場企業の営業会社でそれなりの社員数もいたが、平均値〜の話をすると、みんな途端にわからなくなるのだ。なので、一応ここから始めてみようと思った次第である。 それでは、Let’s do it.

平均値について

これは、もう説明しなくとも分かるだろう。下記の図を見て欲しい。

各都道府県の平均月給を出した図

この図は、各都道府県の平均月給を図に表したものである。この図を見てパッと分かる事は、 「東京の平均月給高っ!」だったり、「青森県の平均月給が一番低いのか」だったりするだろう。これをどうやって計算したのは、分からないが、もし僕が各都道府県の平均給与を計算するなら、

(島根県の総合計月給)➗(島根県の働いている人数)

と、なるだろうか。ここまでは、小学生?中学生で習う内容なので、これくらいにしておこう。

中央値について

先ほどの図をもう一度見て欲しい。これを見て、「やっぱり、東京に行けばめちゃくちゃ稼げるぜ!だって平均値でダントツトップだもん!」と思った方。中央値について勉強して欲しい。

中央値とは、代表値の一つで、有限個のデータを小さい順に並べたとき中央に位置する値。たとえば5人の人がいるとき、その5人の年齢の中央値は3番目に年寄りな人の年齢である。ただし、データが偶数個の場合は、中央に近い2つの値の算術平均をとる。中央値の事を、メディアン、メジアン、中間値とも呼ぶ。

ウィキペディア

よく分からないですよね。もう一度平均値について、今度は図で見てみよう。

平均値

計算式は端折るが、この場合の平均値は、600円となる。                  では、中央値ではどうだろうか!?

中央値

おっと、平均値と中央値の値が違うものになった。どういう事なのだろうか!?

簡単に言うと、所持金を基準に降順・昇順どちらでも良いので並べた上で、真ん中に来る人の金額を、この場合の中央値とするのである。

つまり、簡単に言うと中央値の求め方は、

降順または、昇順に求め変える→真ん中を抜き出す→その値自体が中央値

となる。

まとめ

仮に、年収1万円の人が9人+年収91万円の人が1人の計10人の平均値を求めようとすると、年収平均値10万円になってしまうのである。年収1万円人が大半を占めるのにも関わらず、1人が91万円もらっているがゆえに、無駄に平均値が上がってしまているのである。もし転職先が、このような実態にも関わらず、平均年収10万円となったらたまったもんじゃない。(この場合、10万円とという数字自体の話はしていないので、悪しからず)

ただ、勿論この場合の10万円がという平均値が間違っているものではない。正しい計算方法で、正確な計算をした上で出た値なのである。

何を言いたいかと言うと、

そもそもの計算のロジックをきちんと理解し、我々が欲しい情報は何なのか?を正確に見極める事が非常に重要である

という事だ。AIが如何に情報を提供してくれようとも、それが正確な情報なのか?そもそも欲しい情報で間違いないか?などは、人間自身が考える必要がある。統計学を学習するという事が如何に大切な事が理解してくれただろうか。

最後に再度、下記を図を見て欲しい。

これは、あくまで各都道府県の平均値を出している。もうここまできちんと理解してくれている人なら察しが付いているだろうが、東京の場合、めちゃくちゃ月給が高い人が多く存在している(可能性が高い)という事だ。上位1%の人が月給1億もらっているだけで、平均値があてにならない情報になっていると、感覚的に理解してもらえると思う。

僕たちが、何を信じればいいのか!?何を作り出そうとしているのか!?を正確に把握する一つの手段として、これからも統計学を一緒に勉強していければと思う。

次回は、平均偏差についてお話します。

コメント

タイトルとURLをコピーしました