![](https://blogimg.goo.ne.jp/user_image/38/86/cd23568dea2ea81a1a104233ed7b9efd.jpg)
データサイエンスに関する記事である。
- ☞時系列分析の単位根過程(または1次和分過程)とランダムウォーク
- 対数差分を活用した解析をするために
- 非定常な系列を定常性を持った系列に変換する
※前回の記事参照。出来次第リンク付けます。
時系列分析を行う際に頻出するもので、身近な時系列データの多く(例を挙げるなら株価など)は単位根過程の一つであるランダムウォークに従うと言われている。また、統計を学んでいる方であればご存じのARIMAモデル(「Auto Regressive(自己回帰)」と「Moving Average(移動平均)」の「Integrated(統合・和分)」のイニシャル)もその一つ。
今回は、単位根過程とは何ぞや?に始まり、その後に代表的な単位根過程に関連する和分過程(これは簡単に)とランダムウォークについて記す。
★単位根過程(1次和分過程)
単位根過程は以下のように定義される。
任意の時間の値をy(t)(簡単のため現在)が非定常であり、また、一つ前の値y(t-1)との差分系列y(t) - y(t-1) = Δy(t) が定常であるとき、y(t)は単位根過程である。
では、時系列分析を行う上で、どのような場合に単位根過程を用いるのか。
・単位根過程を用いたモデルについて考えるとき。
・時系列データの回帰分析を行うとき。
ただし、時系列データの回帰分析を行う際、単位根過程に従う二つの系列x(t):株価系列、y(t):地震活動系列があったとして(もちろん全く関係がない2つのデータであるが)、これらを回帰させてしまうと、あたかも有意な相関を見出してしまう「見せかけの回帰」が行われてしまう。これを避けるには単位根検定を行う必要がある。
※単位根検定については別記事にてPythonコードとともに記載する予定(予定は未定w)。
★和分過程
和分過程は、一階差分( t-1 )の定常性->(これを1次和分過程と呼ぶ)に限らず、n階差分について考えることができるため、表現できるモデルの幅が広がる。
★ランダムウォーク
代表的な単位根過程である。これはどのような式で表されるのか。
◆drift項を持つランダムウォーク p(t) = p(t-1) + μ + e(t)
- p(t)、p(t-1)は非定常である。
- μはランダムウォークのドリフト項と呼ばれ、トレンドを表現。
- e(t)は平均0、分散σ^2のガウス分布を示す。
◆差分系列(これはlog returnを表す。) r(t) = p(t) - p(t-1) = μ + e(t)
- r(t)は平均μ、分散σ^2のガウス分布を示す。
- μ + e(t)は定常過程である。
だいぶ割愛させてもらったが、とある分野においてこの考え方は非常に重要になってくるため、ヒントは載せたがここでは敢えて簡単に書くこととした。
以上を持って、第1回目は終了。
※コメント投稿者のブログIDはブログ作成者のみに通知されます