時系列データは過去のデータを解析して将来予測を行いますので、過去のデータなくして成り立ちません。
ここでは、
野菜価格を例題にしていますが、株価などの金融商品でも、また、ビジネスの現場で起こる事例でも同じです。
今回は、
ホウレン草の卸売価格を例題に標本自己相関分析をご紹介しましょう。
自己相関分析によって、ホウレン草価格の循環変動を見る訳です。
表1は、
「平成23年11月下旬、12月上旬・中旬」~「平成26年7月下旬、8月上旬・中旬」のホウレン草価格の抜粋です。
詳しくは、
下記URL(中四国農政局の「主要野菜の入荷量及び卸売価格の見通し)を見て下さい。
http://www.maff.go.jp/chushi/seisan/vegetable/sijyo_mitousi/index.html
表1 ホウレン草価格のデータ
表1 のデータを折れ線グラフにすると図1 の様な変動が見られます。
図1 ホウレン草価格の時系列プロット
図1 の様にホウレン草価格は循環変動(収穫期、夏場)していることが分かります。この循環変動の統計量は自己相関係数で記述します。
一般のデータでは平均値や標準偏差あるいは相関係数をもって、そのデータの特徴を表します。同じ様に、時系列データは、平均値や標準偏差に加えて自己相関係数でその特徴を示します。
このブログを読んで、
あなたの報告書に自己相関を書き加えれば、一目も二目も置かれる事でしょう!
しかし、
その結果の解釈や考察がなされなければ、知ったかぶりになってしましますので、成書などを見て基礎的な知識を得ておいて下さい。
それでは、
表1 のデータについて自己相関分析を行って見ましょう。
ここでは、前号(7) と同じ様にデータ解析環境「R]で行いました。
「R」関数
dat<- read.delim("clipboard", header=T)
head(dat)
acf(dat, type="correlation", lag.max=50, plot=TRUE, main="Spinach price")
実行結果を図2 に示します。
図2 標本自己相関コレログラム
図2 において、縦軸の”ACF” は自己相関係数であり、横軸は”Time Lag” です。
”Time Lag=16,17,18”でマイナス相関を、”Time Lag=34,35,36”でプラス相関となっています。
この Time Lag から、このデータにおける過去の低価格の時期は「平成24年4月下旬~5月中旬」で、高価格の時期は「平成24年10月下旬~11月中旬」でした。よって、
このデータのホウレン草価格の変動は、"Time Lag=18" で循環変動していると考えられます。要するに、
約1年周期であり、常識的に10月下旬頃からの種マキ、3月上旬頃からの収穫、そして夏場の品薄を繰り返している事になります。
もっとも最近では、ハウス栽培(野菜の工業化)で年中市場に出回っており季節感が薄らいでいますが・・・。
次回に続く!
情報統計研究所はここから。