回帰の性能指標
回帰の性能指標として、一般的には平均二乗誤差(RMSE:Root Mean Square Error)を用いる。
しかし、外れ値となる区域が多数ある場合は平均絶対誤差
(MAE:Mean Absolute Error)を使うことを考えると良い。
実測値と予測値の差の絶対値の平均をとる。
これらはどちらも二つのベクトルの距離を測定する方法である。
距離の指標として、ノルム(norm)がある。
平均二乗誤差はユークリッドノルムに対応する。l2ノルムとも呼ばれる。
平均絶対誤差はマンハッタンノルムに対応する。l1ノルムとも呼ばれる。
マンハッタンノルムとは斜めには移動できず、縦と横だけというイメージ。
ノルムの値が大きくなればなるほど、大きい値を重視し、小さい値を無視する方向に傾く。
そのため、RMSEはMAEより外れ値の影響を受けやすい。