計算方法も解説!AIで使う距離5選!ユークリッド距離、コサイン距離、マハラノビス距離、マンハッタン距離、チェビシェフ距離

こんにちは!
IT企業に勤めて、約2年間でデータサイエンティストになったごぼちゃん(@XB37q)です!

このコラムでは、数学の世界で使われる距離について紹介します!
距離と聞くと、~mや~kmといった距離を想像しませんか?

現実の世界の場合、距離は1つですが、数学の世界では違います!
また、AIにも距離の考え方が使われる場合があります!

距離とは

$P$と$Q$の距離を求める場合、$x_{1}$ や $x_{2}$ などの数値から距離を求めます!
様々な距離の求め方がありますが、どの距離を使うのかは正解がなく、場面によって使い分けることが重要です!

このコラムでは、下記5種類の距離を紹介します!

  • ユークリッド距離
  • コサイン距離
  • マハラノビス距離
  • マンハッタン距離
  • チェビシェフ距離

ユークリッド距離

ユークリッド距離
ユークリッド距離

ユークリッド距離は、日常で用いる距離と同じであり、一般的な距離です。
平面の場合、2点の座標が求まればピタゴラスの定理で求めることが可能です。

コサイン距離

コサイン距離
コサイン距離

コサイン距離は、距離ではなく角度を表す値です。
ベクトルの向きが一致している場合に最大値の1、ベクトルの向きが直交している場合に0、ベクトルの向きが逆の場合に最小値の-1をとります。
つまり、ベクトルの向きの類似性を表す値になります。

例えば、1つの文書Aをコピーし、長さだけを増やした新しい文書AAを作成した場合、この2つの文書は全く同一であり、コサイン距離は1と見なされます。

マハラノビス距離

マハラノビス距離
マハラノビス距離

マハラノビス距離は、変数同士に相関がある場合に用いられる距離です。
相関が強い方向の距離は実際の距離よりも相対的に短くするという考え方です。

例えば、身長と体重の2軸を考えた場合、身長が低くて体重が軽いAさん、身長が高くて体重が軽いBさん、身長が大きくて体重が重いCさんの3人で距離を考える場合、AさんとCさんは体格が似ているという観点から、AさんとCさんの距離は近いと考えることができます。
また、AさんとBさんは体重が軽いですが、体格の観点からはBさんのほうが瘦せ型という結果になるため、AさんとBさんの距離は遠いと考えることができます。

マンハッタン距離

マンハッタン距離
マンハッタン距離

マンハッタン距離は、碁盤の目を移動する時の距離であり、どこを通っても最短距離は等しくなります。

例えば、地点Pから地点Qに行く場合、最低でも10ブロックを通過する必要があります。
そのため、マンハッタン距離は10となります。

マンハッタン距離は、数価を2乗していないため、他の指標と比較して外れ値の影響を抑えることができます。

チェビシェフ距離

チェビシェフ距離
チェビシェフ距離

チェビシェフ距離は、斜めも同じ距離と考えるため、正方形に広がっていく距離です。

まとめ

  • 距離とは
    • AIの考え方で使われる
    • 数値から距離を求めることが可能
    • 様々な距離の求め方がある
    • どの距離を使うのかは正解がなく、場面によって使い分けることが重要
  • 一般的に使われる5つの距離
    • ユークリッド距離
    • コサイン距離
    • マハラノビス距離
    • マンハッタン距離
    • チェビシェフ距離

参考図書

※「言語処理のための機械学習入門」には、コサイン距離が説明されており、他の距離は説明されておりません。

計算方法も解説!AIで使う距離5選!ユークリッド距離、コサイン距離、マハラノビス距離、マンハッタン距離、チェビシェフ距離” に対して1件のコメントがあります。

コメントは受け付けていません。