統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

統計のコツのこつ(27)

2016-12-08 17:42:03 | 日記・エッセイ・コラム
このブログは「すぐに役立つ統計のコツ」(オーム社)に紹介されている内容を補足するためのものです。
 
 
前回に引き続き「第2章 分析の準備」(6ページ)を開いて下さい。
医学関連の学会や論文でよく見かけるものに、Plotmeans(平均値±標準偏差又は標準誤差)、Boxplot(箱ひげ図)、Error range with bar graph(エラーバー付き棒グラフ)など色々なグラフ表現があります。
例えば、
図1は HbA1c を前・後で比較したものですが、エラーが標準偏差(sd)なのか標準誤差(se)なのかが分かりませんので、図中に記載しておくのが良いと思います。
 
図1HbA1c 比較の例
一方、
図2は変化率を表したもので、マイナス方向に標準誤差(se)の線を伸ばして、変化率の違いを強調しています。
 
図2 変化率の表現
 
一方、
データの分布を直接プロットして、データのバラツキの様子を示すものに「stripcart」(ストリップチャート)と言われるものがあります。
「すぐに役立つ統計のコツ」ではご紹介していませんが、少数データの表現に適していますので、その作成方法をご紹介しておきましょう。
作成は、データ解析環境「R」での方法です。
「R Consol」に次のコマンドを書いておき、
***
dat<- read.delim("clipboard", header=T)
***
 
例えば、
図1の様なExcelのデータ(項目名を含む)をコピーし、実行すれば「R」に読み込むことが出来ます。
 
図1 性別と年齢のデータ
 
 
***
head(dat) # データの確認
attach(dat)
Age_m<- tapply(Age, Gender, mean) # 年齢の平均値
Age_s<- tapply(Age, Gender, sd)    # 年齢の標準偏差
horiz<- c(1, 2)+0.2
stripchart(Age~ Gender, method="jitter", vert=T, pch=16, ylim=c(30, 90), xlab="Gender", col=c(2, 3))
points(horiz, Age_m, pch=16)
arrows(horiz, Age_m- Age_s, horiz, Age_m+ Age_s, code=3, angle=90, length=0.1) # 平均値±標準偏差の描画
detach(dat)
***
 
実行結果は図2の様になります。
 
図2 ストリップチャート
 
 

次回の予定は beeswarm(蜂群図:蜂の群れ)のご紹介です。
 
情報統計研究所はここから!