新卒1年目の技術に関する備忘録

自主学習で困ったこと、学んだことをまとめています

2018-12-26から1日間の記事一覧

主成分分析

PCAを用いたデータ変換。 (左上)最も分散が大きい方向を第一成分(Component 1)、それに直行する方向で、最も情報をもっている方向を探す。 このようにして見つけていく方向を主成分という。 下図 (左から右に)もとのデータ、変換後のデータ、変換して第…

様々な前処理

データの前処理として、主にStandardScaler、RobustScaler、MinMaxScaler、Normalizerの変換の4つがある。 StandardScaler 平均が0、分散が1になるようにする(z変換)。 ※特徴量の最大値や最小値が、ある範囲に入ることを保証するものではない。 RobustScal…