統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

統計技術 第Ⅲ部:第2章 多変量記述統計(1)

2022-05-08 10:55:18 | 日記・エッセイ・コラム

統計技術 第Ⅲ部:第2章 多変量記述統計

第2章 Bivariate Descriptive Statistics (二変量記述統計)
Wessa.net 事例集から、2つ以上の変量からなるデータの統計量記述に関する技術を紹介する.
多変量、すなわち2つ以上ののグループ化されていない独立した2つ以上の標本の生データの統計量であり、2つ以上の相関関係や代表値の有意差検定など多岐の分析となる.
なお、例題は、そのまま利用するので、実際の分析に当たってはサイトの使用方法に従って実行されたい.

● Free Statistics Software (Calculator) - Web-enabled scientific services & applications 
 https://www.wessa.net

第2章-1 Bivariate Descriptive Statistics (二変量統計記述)
二変量記述統計では、2つの標本の変数を分析・比較して、変数間に関係を要約する.

「Wessa.net」のTop ページから、
 Descritive Statistisc を選択

下方にスクロースして、

図1 「Bivariate Descriptive Statistics」のデータ入力画面


● Correrationを選択

図1 データ入力画面


「Compute」をクリック

図3 出力結果(1)

 

ここで、
.統計量とExcel 関数は次の通りである.
------------------------------------------------------------------------------
Mean:平均値.....=AVERAGE()
Biased Variance:母集団分散.....=VAR.P()
Biased Srandard Deviation:母集団標準誤差.....=STDEV.P()
Covariance:標本共分散.....=VAR.S()
Correlation:相関係数(r).....=CORREL()
Determination:決定係数(R^2).....=r^2
T-Test:相関係数のt検定....Excel の「データ分析→回帰分析」
p-value(2 sided):相関係数のt検定の両側p値....上記から
p-value(1 sided):相関係数のt検定の片側p値
95% CI of Correlation:母相関係数の95%CI...下記参照
Degree of Freedom:自由度....N-2=5-2=3
Number of Observations:データ数....N=5
-------------------------------------------------------------------------------

「95% CI of Correlation」計算の参照先URL:
情報統計研究所(やさしい医学統計手法)

「6.3. 相関と回帰について」を参考にExcel で計算できる.

図3 出力結果(2):Normality Test(正規性の検定)
 Bivariate-4.jpg
 
ここで、
・jarque-Bera Normality Test(ジャック-ベラ検定)

data: X
 JB=0.35208 (p=0.8386、片側検定)

data: Y
 JB=0.54552 (p=0.7613、片側検定)

正規分布に従うSkewness(歪度)かKurtosis(尖度 )かを調べるもので、p値から正規分布と判断される.
なお、
小標本の場合には有意に傾きやすいので、p値の補正が必要との説もある.

次回に続く!