新卒1年目の技術に関する備忘録

自主学習で困ったこと、学んだことをまとめています

ランダムフォレスト

n_estimatorsで決定木の数を、n_jobsでCPUのコア数を指定することが出来る。

ランダムフォレストは乱数のシード(random_state)を変更すると、構築されるモデルが大きく変わる可能性がある。

決定木の数が増えると、シードの選択の影響を受けにくくなる。

max_featuresを大きくすると、ランダムフォレスト中の決定木が似たようになる。

そのため、max_featuresを小さくすると過剰適合が低減する。