統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

統計技術 第Ⅲ部:第5章 2-way ANOVA

2022-08-31 11:54:31 | 日記・エッセイ・コラム

統計技術 第Ⅲ部 Free Online Caluclator (例題集)
第5章-2:2-way ANOVA 

二元配置分散分析(2-way ANOVA)は、すでに、第Ⅰ部:「第11章-2 2元配置分散分析(繰返しあり)」(下記URL)で紹介している.
https://blog.goo.ne.jp/k-stat/e/81cb98056a300b37bba3727efbfe7a3f

ここでは、上記URLを参考に「Free Online Caluclator」(Wassa)で「R」を気軽に使ってみよう.

Wessa.net のTop ページ
 http://wessa.net/

Statistica Hypothesis Testing Software

Bivariate and Multivariate Statistical Hypothesis Testing
 - Ungrouped Data

2-way ANOVA
グループ間のANOVAを計算する.

Data X を確認

Names of X columns を確認

Response:Variable 1 を確認

Factor:Variable 2 を確認
Factor:Variable 3 を確認

Compute

出力結果:
図1 ANOVA table

図2 Tukey Honest の対比較検定の結果

図3 グループごとのBoxPlot

図3 グループ間の相互作用のグラフ

2つの直線(FとM)の伸びは異なっており、交互作用がグラフから確認できる.

それでは、
第Ⅰ部:「第11章-2 2元配置分散分析(繰返しあり)」での例題でやってみよう.

図4 「R」のためのデータフォーム

 
このデータのfactor(A, B)に「” ”」を付けて、Data Xに入力するか、事前にExcel で作成したものをコピー&ペーストすればよい.

その分析結果(出力)は図5のとおりである.

図5-1 入力データ(図4)の出力結果(1):ANOVA model 係数

この例題でのANOVA modelでは・・、
「Resoponce~  Treatment_A * Treatment_B」となっているが、実際には「Value~ factor_A * factor_B」から求めた係数であり、2 つの予測変数間の [*] は交互作用効果もテストすることを示している.
この例では、
応答変数として「Value」 を使用し、2 つの予測変数として「factor_A と factor_B」を使用して、 ANOVA モデルを適合させている.
なお、
このANOVA model から、次により各グループ間の平均値を求めることができる.

図5-2 ANOVA model から求めた各グループ間の平均値

図6 入力データ(図4)の出力結果(2):ANOVA table

2元配置分散分析表であり、「Treatment→facter」である.

図7 入力データ(図4)の出力結果(3):Tukey Honest の多重比較

多重比較の結果を示している.

図8 入力データ(図4)の出力結果(4):グループ間の相互作用のグラフ

この図から、交互作用のあることが視覚的に確認できる(図6のTreatment_A:Treatment_Bのp値=0.004 で有意である).

さらに、
「R」での”Box Plot の描き方”と”グループ間(A、B)の平均値”を紹介しておこう.

「R」コマンド:
----------------------------------------------
ibrary(dplyr) # 事前にインストールしておく
library(ggplot2) # 事前にインストールしておく

# Box Plot の描写
ggplot(data = dat, aes(x = A, y = Value, colour = B)) + 
  geom_boxplot()

# グループ間の平均値
group_by(dat, A, B) %>%
summarise(mean=mean(Value))
----------------------------------------------
出力結果:

図10 グループ間のBox Plot

図11 グループ間の平均値

 


統計技術 第Ⅲ部:第5章 1-way ANOVA

2022-08-21 17:52:25 | 日記・エッセイ・コラム

統計技術 第Ⅲ部 Free Online Caluclator (例題集)
第5章:1-way ANOVA

一元配置分散分析(1-way ANOVA)は、すでに第Ⅰ部:第9章-2 3群における"One way ANOVA" で紹介している(下記URL).
 http://toukei.sblo.jp/article/187608681.html

上記URLを参考に、ここでは「Free Online Caluclator」で「R」を気軽に使ってみよう.

ここでの"1-way ANOVA" calculator は、一元配置分散分析 表(ANOVA tacle) を迅速かつ簡単に作成するのに役立ち、これには、平方和、平均平方、自由度、F 値、P 値など、観測データ セットからのすべての関連情報が出力される.
それでは、やってみよう.

Wessa.net のTop ページ、
 http://wessa.net/

Statistica Hypothesis Testing Software

Bivariate and Multivariate Statistical Hypothesis
  Testing- Ungrouped Data

1-way ANOVA

グループ間のANOVAを計算する.

Data X を確認

Names of Treatment を確認

Response Variable と Facter Variable を確認

Compute 

図1 出力結果(1):分散分析表


図2 出力結果(2):多重比較


「Tukey Honest」とは のテューキーのHSD (honestly significant difference) の多重比較のことである.

図3 出力結果(3):等分散性の検定

等分散性の検定(Levens Test)の結果が出力される.

それでは、別のSampe の事例「第Ⅰ部:第9章-2 3群における"One way ANOVA"」で使用したデータを使ってやってみよう・・、結果は図4の通りである.

図4 「第Ⅰ部:第9章-2」の原データ

上記データを図5のように入力する.

図5 図4のデータの入力様式

「R」のaov() を使用しているので、結果は当然、Free Online Calculator(Wessa.net)と一致する.

 


統計技術 第Ⅲ部:第4章 Skewness-Kurtosis Plot

2022-08-15 11:58:39 | 日記・エッセイ・コラム

統計技術 第Ⅲ部 Free Online Caluclator (例題集)
第4章:Skewness-Kurtosis Plot(Cullen and Frey graph)

Skewness(歪度) と Kurtosis(尖度) テストについては、既に、「統計技術 第Ⅲ部:第1章-3 Histogram(データの分布)」で紹介した.
 https://blog.goo.ne.jp/k-stat/e/b1a12b4c9c3bc356d66b9eefb7476f7c

ここでは、
Wessa.net Topページから、

Statistical Distribution→Skewness-Kurtosis Plot

Data を確認

Compute

出力結果:

図1Empirical density ana Cumlative distribution

通常のヒストグラムと経験的密度関数を表している.

 
図2 skewness-kurtosis plot (Cullen and Frey graph)

当てはめの良さを表すプロット(Cullen and Frey graph)は、一般的にピアソン プロットなど、いくつかの名前があり、歪度と尖度の関係を表しており、視覚的に歪んだ分布かどうかを見るために考案された.

図2の SkewnessとKurtosisの値は、下記URLの「統計技術 第Ⅲ部:第1章-3 Histogram(データの分布)」から、Skewness=0.57707、Kustosis=2.60623 であり、これは図2の●点(Skewness^2=0.333)の位置にあり、ブートストラップによるシュミレーションでは黄色の散布点のように灰色部分のbeta分布領域に散布することが視覚的に知ることができる.そして、どの分布が自分のデータに最も適しているかを確認しモデルの構築の参考にすれば良いと思う.

 


統計技術 第Ⅲ部:第3章-5:PLS-PM(偏最小二乗回帰分析)

2022-08-06 15:35:00 | 日記・エッセイ・コラム

統計技術 第Ⅲ部 Free Online Caluclator (例題集)
第3章-5:PLS-PM(偏最小二乗回帰分析)

この統計技術では、「Free Online Calculator」(Wessan.net)の事例を紹介している.
今回は、Wessa.net のTopページから、
Regression Software→Regression Software→PLS-PM

・・・であるが、これは、

PLSパス・モデリング(Partial Least Squares Path Modeling :PLS-PM)のことであり、観測された変数と潜在変数の間の複雑な多変量関係(構造方程式モデル)をモデル化するための統計的アプローチである.
しかしながら、本Calculator(Wessan.net)で使用されている「plspm」というパッケージは、現在、「R」で使用されておらず、次の errorメッセージとなる.
***
”ライブラリ(plspm)のエラー:「plspm」というパッケージがありません.実行が停止しました”
***
よって、ここでは、

「R」による別法を簡単に紹介するに留めるので、「グラフィカル共分散構造分析」 については専門書や専門サイトを参考にされたい.
入門書としては、
「Excel で学ぶ共分散構造分析とグラフィカルモデリング」(小島隆矢、オーム社刊)が良いかも知れない.

「R」での方法として、簡単な例題でやってみよう.
まずは、
情報統計研究所の「やさしい医学統計手法:9.4.2. 主成分回帰分析(回帰主成分分析)の方法について」(下記URL)から、表1のデータをExcel にコピーして使用する.
 http://kstat.sakura.ne.jp/medical/med_035.htm

図1 Excel にペーストしたデータ

「R」の実行:
----------------------------------------------------
dat<- read.delim("clipboard", header=TRUE)  # 図1のデータをすべて選択しコピーし読込む
head(dat)
library(lavaan)  # 事前にインストールしておく
library(semPlot) # 事前にインストールしておく

model.1 <- 'satus ~ w1+ w2+ w3+ w4' # PLM モデル式
fit.1 <- sem(model.1, data=dat, estimator = "MLR")  # PLMの実行
summary(fit.1, standardized=T, fit.measure=T ) # 統計量の表示

# パス図の描画
semPaths (fit.1, whatLabels = "est",
layout = "tree", style = "lisrel", nCharNodes = 0, sizeMan = 10,
edge.label.cex = 2.0)
----------------------------------------------------
出力結果:

図1 統計量(回帰係数)の出力

図3 PLSパス・モデリング

片側矢線は因果関係を表す数値で回帰方程式の場合は係数を表す.
両方向の矢印の数値は相関性を示す共分散を表しており、Excel 関数では「=COVARIANCE. S( )で求められる」.