新卒1年目の技術に関する備忘録

自主学習で困ったこと、学んだことをまとめています

主成分分析

PCAを用いたデータ変換。

(左上)最も分散が大きい方向を第一成分(Component 1)、それに直行する方向で、最も情報をもっている方向を探す。

このようにして見つけていく方向を主成分という。

下図

(左から右に)もとのデータ、変換後のデータ、変換して第二成分を落としたデータ、第一成分だけを用いて逆回転したデータである。

 

f:id:logz-developers:20181226212549p:plain

主成分のいくつかだけ残したものを逆回転してもとの空間に戻している。

このもとの特徴量空間へ戻す作業は、inverse_transformメソッドで行うことができる。