統計学で使う偏差値!平均点の違いと求め方

こんにちは!
IT企業に勤めて、約2年間でデータサイエンティストになったごぼちゃん(@XB37q)です!

このコラムでは、異なるデータに対しての大小を比較する時に使う偏差値を紹介します!
試験でよく聞いたことがあると思いますが、偏差値にも統計学のエッセンスが詰め込まれているのです!

偏差値とは

偏差値とは
偏差値とは

国語と英語のテストで、どちらも80点を取ったとします。
テストによって平均点や点数のぶれに違いがあるため、どちらのテストの成績が良いのかは、単純に比較できません。

このような場合に、それぞれの偏差値を求めることで、比較が可能になります。

国語と英語の点数は同じでも、生徒Bは国語より英語のほうが成績が良いことが分かります。

偏差値の特徴

異なる項目(科目や競技など)で同じ点数だった場合でも、偏差値は等しくなるとは限りません。
偏差値が高いほど成績が良いことを、低いほど成績が悪いことを表します。
項目の平均値が異なる場合は、偏差値は異なります。
偏差値は、テストの平均が50、標準偏差が10になるように点数を変換して求めます。

偏差値は次のような式で求められます。

偏差値の求め方
偏差値の求め方

具体的には、標準化した値を10倍して50を足すことで求められます。
標準化とは、データをより分かりやすく比較するために、データを変換する作業です。

偏差値と標準化の関係
偏差値と標準化の関係

ある値に対して、値aを掛け算すると、標準偏差 = ある値×a。
ある値に対して、値bを足すと、平均値 = ある値+bとなります。

標準化とは、平均を0、標準偏差を1にするデータ変換方法です。
そのため、偏差値とは、平均50、標準偏差10となるような値になります。

標準化については、下記のコラム「精度に直結!データクレンジングの方法」をご覧ください。

まとめ

  • 偏差値
    • 異なるデータに対しての大小を比較する時に使う指標
    • 異なる項目で同じ点数の場合でも、偏差値は等しくなるとは限らない
    • 平均50、標準偏差10となるような値
    • 標準化した値を10倍して50を足すことにより求める
  • 標準化
    • 平均を0、標準偏差を1にするデータ変換方法