統計モデル その3 SEMによる単回帰
http://blog.goo.ne.jp/xmldtp/e/45e908f31f3060d9e7acb5b753c97493
の続き。「統計モデル」の授業のメモメモ
影響を排除する方法
・偏相関
・パス解析
・重回帰
偏相関
model1<-'
COG~SES
HS~SES
CG~~HS
'
~~が偏相関
パス解析
model2<-'
COG~SES
HS~SE
COG~HS
'
重回帰
model3<-'
COG~HS+SES
'
・効果の有無=有意性検定
・モデルを立てるとき=理由が要る
・回帰係数と因子負荷量は両方ともパス係数と呼ばれる
・偏回帰係数を相関といわないように
→違う概念、値も違う
擬似相関・偏相関係数
誤差の間の相関・擬似相関
→見かけ上の相関
モデルの修正
ビッグファイブの神経質分析
モデル1:よくなかった
モデル2,3:よくなった→こっちがいい
では、どうやってモデル1から3に考えるか
モデルの修正とは
・適合度が悪い場合に、モデルを修正して適合度を上げる
適合が悪いモデルを報告しても意味ない
・どのように修正を行う?
数値的
理論的(意味的)
モデル1のΣの値
RMSEAをみる→悪い値
共分散行列が得られる(fitted())
残差(StoΣの差)
・適合が良いSとΣの差が小さいはず
・データから計算されるS
・モデル1のS-Σ
→絶対値が小さければよい
一部大きく狂っているところがある
この間の共分散がモデルで説明できていない
・残差は、関数residで求まる
モデル2
・その残差を小さくするようなパラメータを入れれば適合が改善する
→RESEAが0で良くなる
→理論的に説明できるか?
モデル3
・だったら、別個の構成概念を測定していることを
直接的に表現
標準化残差
残差にも種類
標準化残差
修正指数
miカイ二乗の減少値
epc
→mi大きいところ探す
Rではmodindices
パス解析
・因果モデルを考えて
・そんなに特別なものじゃない
・因果の方向性を知るのは難しい
・分析者が仮定した因果モデルを分析する手法
事例1:
標準化推定値→分散を1にしたとき
そうでないと、非標準化
非標準化→変数の単位ついてる:単位に依存で解釈
→標準化、非標準化どちらがいいかはケースないケース
決定係数:パス解析でもできる
モデルを変える
誤差分散が小さくなった=説明できない部分が激減
直接効果:ダイレクトに影響
間接効果:何かを介して影響
総合効果=直接効果+間接効果
直接効果の解釈
間接効果の要因が一定の場合、排除した場合
間接効果の解釈
パス間の係数の掛け算
総合効果の解釈
直接効果+間接効果
標準化の場合
分散1になっているので、
変数が1変化すると、1標準偏差変化させることになる
lavvanのくせ
外生的な観測変数=矢印が刺さっていない(出てるだけ)
→自動的に共分散を入れてしまうものがある。
入れたくないとき
変数1~~0*変数2
~~(共分散)で、0をかけることにより、0になり、入らない
sem(model1,sample・・・,fixed.x=T)
fixed.x=Tの説明は省略
従属変数に複数の変数(X1,X2,X3)が影響する場合
X2,X3が一定の場合には、
X1が大きくなると、Yは○大きくなる
と解釈する
パス解析におけるSとΣ
・確認的因子分析の場合と同じように
標本データから計算される共分散行列Sと
モデルから計算される共共分散行列Σの差を
小さくするようなパラメタをもとめる
丁度識別=飽和モデル
潜在変数間のパス解析
・観測変数の背後にある構成概念をとりdス
因子分析によって
・パス解析と因子分析の合体
・合計得点の間のパス解析はメリットない
→希薄化の修正
決定係数:やじるし刺さっているすべてもとめられる
確認的因子分析モデルの識別
・なぜ因子の分散=1
・誤差からの係数=1
内生的因子がある場合の識別
・矢印が刺さっている:内生的因子
・内生的因子の分散=パス係数の2乗+内生的因子の誤差分散の和
・一般的には因子負荷量の1つを1に固定
→lavvanのデフォルト
希薄化および希薄化の修正
合計得点でなく、因子間の相関を求める3つの理由
・構成概念に近いのは因子
・因子間の相関のほうが絶対値が大きくなる
→相関の希薄化
・単回帰・重回帰分析:飽和モデルであっても、
因子を仮定すると、適合度が求まる
因子間相関と合計得点間相関
・因子の中に誤差は入っていない=分離されてる
・合計には、誤差が含まれる
等値制約
・複数のパス係数が等しい値であるという制約
→パラメータの数が減る:倹約的
・等値制約を課すと、適合度が良くなることがある
Rだと、モデルのところで
f1=~v1*x1+v1*v2
誤差分散の場合
x1~~e1*x1