新卒1年目の技術に関する備忘録

自主学習で困ったこと、学んだことをまとめています

2019-01-09から1日間の記事一覧

テールヘビーの分布の前処理

ヒストグラムがテールヘビー(中央値の左側よりも右側が大きく広がっている)だと、機械学習アルゴリズムはパターンを見つけにくくなることがある。 そういう属性は、ベル型の分布に近づくように変換する。

カスタム変換

変換器を自分で作りたい時は、TransformerMixinとBaseEstimatorを基底クラスに追加すれば良い。