新卒1年目の技術に関する備忘録

自主学習で困ったこと、学んだことをまとめています

大規模データの線形回帰

サンプル点が10万、100万点のように非常に大きい場合も線形モデルは高速である。

このようにサンプル数が多い場合は、solver = 'sag'を指定すると高速化が見込める。

 

SGDClassifierクラスとSGDRegressorクラスを使う方法もある。

SGDは大規模なデータに適した線形モデルである。