新卒1年目の技術に関する備忘録

自主学習で困ったこと、学んだことをまとめています

回帰の性能指標

回帰の性能指標として、一般的には平均二乗誤差(RMSE:Root Mean Square Error)を用いる。

しかし、外れ値となる区域が多数ある場合は平均絶対誤差

(MAE:Mean Absolute Error)を使うことを考えると良い。

実測値と予測値の差の絶対値の平均をとる。

 

これらはどちらも二つのベクトルの距離を測定する方法である。

距離の指標として、ノルム(norm)がある。

平均二乗誤差はユークリッドノルムに対応する。l2ノルムとも呼ばれる。

平均絶対誤差はマンハッタンノルムに対応する。l1ノルムとも呼ばれる。

マンハッタンノルムとは斜めには移動できず、縦と横だけというイメージ。

ノルムの値が大きくなればなるほど、大きい値を重視し、小さい値を無視する方向に傾く。

そのため、RMSEはMAEより外れ値の影響を受けやすい。