新卒1年目の技術に関する備忘録

自主学習で困ったこと、学んだことをまとめています

凝集型クラスタリング

個々のデータポイントをそれぞれ個別のクラスタとして開始し、最も似た2つのクラスタをくっつけていく。

指定したクラスタの数になるまでそれを繰り返す。

連結度

ward

併合した時に、クラスタ内の分散の増分が最小になるように2つのクラスタを選択する。これがデフォルト。

 

average

全てのポイント間の距離の平均値が最小の2クラスタを併合する。

 

complete

2つのクラスタの点間の距離の最大値が最小となるものを併合する。

 

f:id:logz-developers:20181227222438p:plain