統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

統計技術 第Ⅲ部:第1章-2 Variability(分散の記述)

2022-04-15 15:15:49 | 日記・エッセイ・コラム

統計技術 第Ⅲ部 Free Online Caluclator (事例集)
第1章-2  Variability(分散の記述)

 データを代表する統計量には次のようなものがある.
例題をそのまま使って体験してみよう・・、実際の分析に当たってはサイトの使用方法に従って実行されたい.

● Free Statistics Software (Calculator) - Web-enabled scientific services & applications 
Wessa.net  site のTop page から、
 https://www.wessa.net

「Descritve Statistics」→「Variability」を選択.

「Compute」をクリック

図1 出力結果(代表的統計量)


Excel では、
図2 出力結果(代表的統計量)

その他の代表的な統計量として四分位範囲(Interquartile Difference:IQR) は、
参照URL:
---------------------
https://supernova.wessa.net/new/freestatistics/org/blog/index.php        v=date/2016/Nov/18/t14794704531o8gvf7xrven3gc.htm/&submit=Print
---------------------

(1) Interquartile Difference (Weighted Average at Xnp)→180
(2) Interquartile Difference (Weighted Average at X(n+1)p)→181.5
(3) Interquartile Difference (Empirical Distribution Function)→180
(4) Interquartile Difference (Empirical Distribution Function - Averaging)→181

ここで、Excel での方法:
例題での、n=144, p1=0.25, p2=0.75 であるので、

(1)の「Weighted Average at Xnp」 は、小さい順に並べたデータから数えて、
 25% tile = n* p1 = 144* 0.25 = 36    番目の値は→180
 75% tile = n* p2 = 144* 0.75 = 108 番目の値は→360
 IQR = 360 - 180 = 180

図3 昇順順位での36番目(黄色セル)・37番目(緑色セル)と108番目・109番目(緑色セル)のデータ

(2)の「Weighted Average at X(n+1)p」は、
 25% tile = (n+1)* p1 = 145* 0.25 =   36.25  → 36番目の値は「180」, 37番目の値は「180」
 75% tile = (n+1)* p2 = 145* 0.75 = 108.75 → 108番目の値は「360」, 109番目の値は「362」
よって、
 25% tile = (1-0.25)* 180(36番目の値)+(0.25)* 180(37番目の値) = 180
 75% tile = (1-0.75)* 360(36番目の値)+(0.75)* 362(37番目の値) = 361.5
 IQR = 361.5 - 180 = 181.5

(3)の(Empirical Distribution Function(経験分布関数)」は、
  上記の方法に従って、IQR=180

(4)の「Empirical Distribution Function - Averaging」は、
  Fractional part(少数部)が「0」なので、(Xi + Xi+1)/2 から、
  25% tile=(180+180)/2=180, 75% tile=(360+362)=361
     よって、
  IQR=361-180=181

詳しくは、先に示した参照URLで、そして、データ解析環境「R」との関連は、下記URLでみることができる.
https://en.wikipedia.org/wiki/Quantile#Estimating_quantiles_from_a_sample

 



最新の画像もっと見る