実データとして、血圧計のデータから最高血圧、最低血圧からなる測定値の分類を試みた続きで、クラスターの数を変更してみる。
scikit learnの KMeansを使って、クラスター数 n_clusters を 2から5まで変えた結果が以下のとおり。
なにかこう、最高血圧でスライスしてn_clusters個に等分した感じ。
scikit learnのGaussianMixtureでクラスター数 n _componentsを2から5まで変えた結果は以下のとおり。
こちらは、KMeansほどスライスしたという感はないけど、一つ固まりを見つけて、あとを等分したという感がある。
いずれにしろ、最高血圧・最低血圧のペアデータ全体を見ると、楕円の一塊とはずれ値がちょぼちょぼ、なので分けるのに無理があるのだろうが... 別の軸を入れるとどうなるだろう (続く)
scikit learnの KMeansを使って、クラスター数 n_clusters を 2から5まで変えた結果が以下のとおり。
なにかこう、最高血圧でスライスしてn_clusters個に等分した感じ。
scikit learnのGaussianMixtureでクラスター数 n _componentsを2から5まで変えた結果は以下のとおり。
こちらは、KMeansほどスライスしたという感はないけど、一つ固まりを見つけて、あとを等分したという感がある。
いずれにしろ、最高血圧・最低血圧のペアデータ全体を見ると、楕円の一塊とはずれ値がちょぼちょぼ、なので分けるのに無理があるのだろうが... 別の軸を入れるとどうなるだろう (続く)
※コメント投稿者のブログIDはブログ作成者のみに通知されます