2018年6月26日のブログ記事一覧-ウィリアムのいたずらの、まちあるき、たべあるき

正常と異常を分けるため、データをK-meansでクラスタリングすると、うまくいかないことがあるけど・・・

2018-06-26 14:05:31 | Weblog

・・・その理由の文章の出典、やっと見つけたので、メモ

【その理由】
幸福な家庭はどれも似たものだが、不幸な家庭はいずれもそれぞれに不幸なものである。

【出典】
アンナ・カレーニナ

そうだそうだ、そうだった（＾＾）ｖ

ありがとう、

名言ナビ
https://meigennavi.net/word/031/031299.htm

ちなみに、解説すると。。
正常のデータは、似ているんだけど、
異常のデータはさまざま。なので、全く違う要因がいくつもあることがある。
ところが、k-meansの場合、いくつにわけるのを、あらかじめ入れてしまう。
２（正常と異常）にすると、異常はさまざまあるので、むしろ、正常値のほうが近くなって、うまく分離できない。
じゃあ、異常のグループは、いくつあるか・・というと、わからない

結果として、極端な異常値を中心として、正常値が２つにわかれてしまったりする・・・

【対策】

外れ値分析をする。
http://www.stat.go.jp/training/2kenkyu/pdf/ihou/67/wada1.pdf
https://support.minitab.com/ja-jp/minitab/18/help-and-how-to/statistics/basic-statistics/how-to/outlier-test/perform-the-analysis/select-the-analysis-options/
https://bellcurve.jp/statistics/blog/14290.html
http://univprof.com/archives/16-07-19-4830461.html

ランキングに参加中。クリックして応援お願いします！

記事一覧 | 画像一覧 | フォロワー一覧 | フォトチャンネル一覧

日	月	火	水	木	金	土
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

アクセス
閲覧	1,428	PV
訪問者	536	IP
トータル
閲覧	34,909,573	PV
訪問者	8,721,422	IP
ランキング
日別	811	位
週別	545	位

	【11/18】goo blogサービス終了のお知らせ
	【PR】プロ直伝・dポイントをザクザクためる術
	【PR】安い＆大量の「訳あり商品」がヤバい!
	【コメント募集中】「GWに旅行予定」はありますか？

ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです（たま～にコンピューター関係も）

正常と異常を分けるため、データをK-meansでクラスタリングすると、うまくいかないことがあるけど・・・

カレンダー

ブログランキング

アクセス状況

プロフィール

最新記事

カテゴリー

最新コメント

バックナンバー

ブックマーク

goo blog おすすめ

goo blog お知らせ

ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです（たま～にコンピューター関係も）

正常と異常を分けるため、データをK-meansでクラスタリングすると、うまくいかないことがあるけど・・・

カレンダー

ログイン

ブログランキング

アクセス状況

プロフィール

最新記事

カテゴリー

最新コメント

バックナンバー

ブックマーク

goo blog おすすめ

goo blog お知らせ