理乃美

ソフトとハードと論理の覚え書き

血圧データをクラスター分析してみる

2018-04-21 23:27:52 | AI
実験用のデータを使ってKMeanを試したあとは、実データで試してみる。

データはCSVファイル(data1.csv)で用意した。これを、Pandasを使って読み込む。



これの最高血圧/最低血圧の組のクラス分けを試みる。

まずは、KMeansで2クラスに分けてみた。



人間の目からみれば、「棒状の塊が一つと右のほうにはずれ値がぱらっとある」という感じ。だが、KMeansの結果は、「最高血圧130を境に二つに分けました」とでも言った結果になった。

GaussianMixtureをつかって2クラスに分けるとこうなる。



「右下に塊が一つ、あと残りを全部」という感じ。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする