実験用のデータを使ってKMeanを試したあとは、実データで試してみる。
データはCSVファイル(data1.csv)で用意した。これを、Pandasを使って読み込む。

これの最高血圧/最低血圧の組のクラス分けを試みる。
まずは、KMeansで2クラスに分けてみた。

人間の目からみれば、「棒状の塊が一つと右のほうにはずれ値がぱらっとある」という感じ。だが、KMeansの結果は、「最高血圧130を境に二つに分けました」とでも言った結果になった。
GaussianMixtureをつかって2クラスに分けるとこうなる。

「右下に塊が一つ、あと残りを全部」という感じ。
データはCSVファイル(data1.csv)で用意した。これを、Pandasを使って読み込む。

これの最高血圧/最低血圧の組のクラス分けを試みる。
まずは、KMeansで2クラスに分けてみた。

人間の目からみれば、「棒状の塊が一つと右のほうにはずれ値がぱらっとある」という感じ。だが、KMeansの結果は、「最高血圧130を境に二つに分けました」とでも言った結果になった。
GaussianMixtureをつかって2クラスに分けるとこうなる。

「右下に塊が一つ、あと残りを全部」という感じ。