新卒1年目の技術に関する備忘録

自主学習で困ったこと、学んだことをまとめています

k-meansクラスタリング

データのある領域を代表するようなクラスタ重心を見つけようとする。

個々のデータポイントを最寄りのクラスタ重心に割り当てる。

個々のクラスタ重心をその点に割り当てられたデータポイントの平均に設定する。

データポイントの割り当てが変化しなくなったら、アルゴリズムは終了する。

f:id:logz-developers:20181227172309p:plain