非負値行列因子分解(NMF)
Non-negative matrix factorization
有用な特徴量を抽出することを目的とする教師なし学習手法の1つである。
アルゴリズムの動作はPCAと似ていて、次元削減に用いることが出来る。
PCAでは、個々の成分はデータの分散を可能な限り説明する、互いに直行するものである必要があった。
NMFでは成分とその係数が常にゼロ以上であることが求められる。
NMFは、複数の人が話している音声データや多数の楽器からなる音楽などから、もとの成分を特定するときなどに有効である。
NMFはPCAより理解しやすい成分に分解してくれる。
負の成分があるとお互いに打ち消したりして、理解しづらい挙動になるが、NMFにはない。
原点(0,0)に対してどの位置にあるのかがNMFでは問題になる。
PCA基礎
PCAのwhitenオプション
主成分が同じスケールになるように変換する。
PCA後にStandardScalerをかけるのと同じ。
主成分分析
PCAを用いたデータ変換。
(左上)最も分散が大きい方向を第一成分(Component 1)、それに直行する方向で、最も情報をもっている方向を探す。
このようにして見つけていく方向を主成分という。
下図
(左から右に)もとのデータ、変換後のデータ、変換して第二成分を落としたデータ、第一成分だけを用いて逆回転したデータである。
主成分のいくつかだけ残したものを逆回転してもとの空間に戻している。
このもとの特徴量空間へ戻す作業は、inverse_transformメソッドで行うことができる。