新卒1年目の技術に関する備忘録

自主学習で困ったこと、学んだことをまとめています

2018-12-20から1日間の記事一覧

大規模データの線形回帰

サンプル点が10万、100万点のように非常に大きい場合も線形モデルは高速である。 このようにサンプル数が多い場合は、solver = 'sag'を指定すると高速化が見込める。 SGDClassifierクラスとSGDRegressorクラスを使う方法もある。 SGDは大規模なデータに適し…

ロジスティック回帰の基礎

LogisticRegressionではパラメータCを大きくすると、適合度を上げようとし、小さくすると係数を0に近づけようとする(正則化)。