dlmの使い方

Home＞Ｒな予測＞ｄｌｍの使い方

　ｄｌｍの使い方

★新サイト完成しました!
３秒後に自動的に移動します

変わらない方はこちらからどうぞ
http://logics-of-blue.com/dlm%E3%81%AE%E4%BD%BF%E3%81%84%E6%96%B9/

Rのｄｌｍパッケージを用いて、動的線形モデル（正規線形状態空間モデル）を推定する方法を書きます。

状態空間モデル関連のページ
　状態空間モデル　　　　　　　状態空間モデルのことはじめ　
ｄｌｍの使い方　　　　　　　　Ｒで正規線形状態空間モデルを当てはめる
　　ローカルレベルモデル　　　ｄｌｍパッケージを使ってローカルレベルモデルを当てはめる
　　季節とトレンド　　　　　　　　dlmパッケージを使って季節成分とトレンドの入ったモデルを作る
　

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　作成日　　２０１２年８月８日　
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　最終更新　２０１２年　８月　８日

状態空間モデル推定の流れ

状態空間モデルの細かい理屈は、実例を見せながら説明します。
　　そのまえに、どうやって状態空間モデルをRで推定するのかを説明します。

Step1　状態空間モデルの「型」を決める
　 Step2　その「型」にいれるパラメタを推定する
　 Step3　Step2で推定されたパラメタを「型」に入れてカルマンフィルターを回す
　 Step4　カルマンフィルターの結果を使ってスムージングする

Step4の「スムージング」はまだ説明してませんが、下のほうで説明します。”予測”だけを目的とするならばなくてもいいかもしれませんが。

この流れは、ｄｌｍパッケージだけではなく KFASパッケージという状態空間モデルを推定できる別のパッケージを使っても、大体同じ流れになると思います。

Step 1状態空間モデルの「型」を決める

「型」というのは私の造語なのですが、その心はわかっていただけるんじゃないのかなと思います。

状態空間モデルにはいろいろな「型」があります。
　　状態空間モデルが表す「状態」の変化のパタンがたくさんあるということです。また、「状態」から「観測値」へと変換されるプロセスにもいろいろなものが考えられます。まずはその「型」を決めるところから始まります。

「型」の決め方は、対象に対してもともと持っていた知見を用いるというものになります。たとえば、２０００年に資源量が低位だったら、２００１年に突然高位になるということはたぶんないだろうなというのが経験上わかっていたとします。２００１年にいったん中位になってから２００２年くらいに高位になるだろうなと。こういう知識があると「資源量は一気には変化しない」けれども「緩やかな変化が続けば、かなり多い値にも低い値にも上下する」という状態の変化のパタンを設定してやればよいということになります。

この「型」が決まらなければ、ここから先には進めません。ここが最も頭を使うところなのかもしれません。

いろいろな「型」については実例を取り上げながら主に次のページ以降で説明します。

dlmパッケージだと、dlmModPoly( ) とか dlmModReg( ) とかいろいろな「型」が用意されているので簡単に「型」を設定することができます。また、これらの「型」はたとえば
dlmModPoly( ) + dlmModSeas( )　みたいに結合させることができます。　
これはRならではのお手軽さですね。WinBUGS使うとこうはいきません

型の一覧を書いておきます。今の段階でこれらの型の意味を理解する必要はありません。
　　次のページから実例を挙げて順にみていきます。

dlmModPoly( )　
order=1ならローカルレベルモデル（ランダムウォーク　プラス　ノイズモデル）
order=2ならローカル線形トレンドモデルを組むことができます。

dlmModReg( )
回帰分析のようにほかの説明変数の影響を加えられます。たとえば気温が高くなるとビールがよく売れるとかいうのを説明するために「気温」という説明変数を導入したりとか。

dlmModSeas( )
季節変動を入れたモデルを組むことができます。

dlmModtrig( )
周期的な変動を入れたモデルを組むことができます。 dlmModSeasと違って三角関数（サインとかコサインとかいうやつら）をつかって周期的な変動を表します。

dlmModARMA( )
状態空間モデルを使ってARMAモデルを推定することができます。

Step 2パラメタを推定する　最尤法

　適当なパラメタを設定してやってdlmパッケージに突っ込んでやればものの１秒もかからずカルマンフィルターを使って状態空間モデルが推定できてしまいます。
　そこで、その前段階にあたるパラメタの推定方法が、われわれエンドユーザー側として重要になる知識の一つなんじゃないかと思います。

パラメタの推定方法にはいろいろあるんですが、ここでは「最尤法」について説明します。

最尤法とは
　パラメタA　を使った時、「今手持ちのデータ」が再現できる確率は３０％
　パラメタB　を使った時、「今手持ちのデータ」が再現できる確率は１０％
であったときに、パラメタAを採用する、という考え方です。なぜならば、パラメタAのほうが「今手持ちのデータが再現できる確率」が高いからです。このように、「今手持ちのデータが再現できる確率」が最も高いパラメタを採用するのが最尤法です。

　たとえば、コインを二回だけ投げて結果が「表・裏」だったとします。このコインの「表が出る確率」というパラメタは一体いくつが妥当だと思いますか？

仮説１　パラメタは　1/3　だ！
仮説1を採用した時に「表・裏」という「今手持ちのデータ」が得られる確率は
1/3　×　2/3　＝　2/9

仮説２　パラメタは　1/2　だ！
仮説1を採用した時に「表・裏」という「今手持ちのデータ」が得られる確率は
1/2　×　1/2　＝　1/4

2/9　＜　1/4　より、仮説2を採用した方が「今手持ちのデータ」が再現できる確率が高い
⇒仮説2「表が出る確率は1/2」を採用する
という流れが最尤法です。

　暇な人は調べてみるといいと思いますが、この場合「今手持ちのデータが再現できる確率」が最も高くなるのはパラメタが1/2のときになります（微分使えば解けます）。
　このように「今手持ちのデータが再現できる確率」が最も高いパラメタが最も尤もらしい（「もっともらしい」と読みます）と考えて、そいつを採用するのが最尤法です。

「今手持ちのデータが再現できる確率」のことを「尤度（ゆうど）」といいます。計算の簡単のため対数を取った対数尤度を使うことが多いです。
　今までの話は、対数尤度が最も高くなる「最大化対数尤度」を得ることができるパラメタを推定する、とカッコよく言い直すとこうなります。

　状態空間モデルにこれを適応します。
　まず「テキトーな」パラメタをつかってカルマンフィルターをしてやり状態空間モデルを推定します。
　そしてそのときの「今手持ちのデータが再現できる確率」を計算してやります。
　その「今手持ちのデータが再現できる確率」が最も高くなるようにパラメタを変更してやって、最も尤もらしいパラメタを見つけます。
　そして、またそのパラメタを使って状態空間モデルを推定しなおしてやれば、最も尤もらしい状態空間モデルが出来上がります。

dlmMLE( )　という関数を使えば簡単に最尤法が適用できます。
じつはこの関数は有名な最適化関数optim( )をそのまま使っています。なのでoptimで使われる匠の技（？）的なパラメタ推定方法がそのまま使えます。技術的な話は実例を挙げながら次のページで説明します。

Step 3　カルマンフィルターする

dlmFilter( 使うデータ，モデルの型 )　で簡単にカルマンフィルターができます。

計算するだけなら一瞬です。

Step 4　スムージングする

そもそも「スムージング」とはなにか、まだ説明していなかったのでここに書きます。

　まず、２０００年のデータから２００１年状態を予測して、そして予測された状態を、２００１年の観測値をもとにして補正しました。このように補正するのがフィルタリングでした。前のページに書いた内容ですね。
　一方のスムージングは、２００２年、２００３、２００４年の観測値を使って２００１年の補正をします。
　別に３年あととかはどうでもよくって、「将来の値をもとにして過去の状態を補正する」のがスムージングの心です。
　将来の値なんてわからないんだからやったって無駄じゃんと思うかもしれませんが、今手持ちのデータすべてを使って過去を説明できるんですから、知識発見という意味合いでは便利です。

dlmSmooth(フィルタリングしたやつ)　で簡単に計算できます。これも１行ですね。

実践　ｄｌｍ

　ｄｌｍしてみます。
　細かい話は次のページ以降で説明するとして、まずはモデルを推定する流れをつかんでもらう程度の中身にします。
すべてまとめたスクリプトはこちらにおいておきます。これはPetris and Petron (2011)を一部改訂したものです。

まず、Nileというデータを使うことにします。これはRにデフォルトで入ってるデータです。

> Nile
Time Series:
Start = 1871
End = 1970
Frequency = 1
[1] 1120 1160 963 1210 1160 1160 813 1230 1370 1140 995 935 1110 994
[15] 1020 960 1180 799 958 1140 1100 1210 1150 1250 1260 1220 1030 1100
[29] 774 840 874 694 940 833 701 916 692 1020 1050 969 831 726
[43] 456 824 702 1120 1100 832 764 821 768 845 864 862 698 845
[57] 744 796 1040 759 781 865 845 944 984 897 822 1010 771 676
[71] 649 846 812 742 801 1040 860 874 848 890 744 749 838 1050
[85] 918 986 797 923 975 815 1020 906 901 1170 912 746 919 718
[99] 714 740

1871年から1970年までのナイル川の流量データです。ちょうど100年間分のデータです。

plot(Nile,type="o",col=8,ylab="",main="Nile")

Nile

Step1から順番にモデルを推定していきます。

　Step1　状態空間モデルの「型」を決める
build.1<-function(theta){
dlmModPoly(order=1,dV=exp(theta[1]),dW=exp(theta[2]))
}
今回は dlmModPoly(order=1ということで、ローカルレベルモデルを推定します。ローカルレベルモデルとは何者かということは次のページで説明します。とりあえず簡単なモデルです。

　ここで　function(theta)とかいう変なものがついていますが、これは自分で関数を作るということを表しています。thetaというパラメタを入れるとdlmModPoly関数を使って独りでにモデルを作ってくれるという関数を作ったんですね。
　こういう風にいったん型を関数にまとめてしまってからパラメタ推定に移ります。optim関数を知っている人はすんなり納得しやすいような気はします。
　今回推定するのは、二つの分散です。一つは観測誤差の大きさ。もう一つは状態そのものが変動するその大きさです。こうやって「状態そのものが変動している」のと「観測誤差が入っている」という両方の変動を加味してモデルを組みます。exp()がついているのは、分散の大きさが絶対正の値になるからその指定のためです。expとは指数ですね。eの何とか乗という値は決して負になりません。

　 Step2　その「型」にいれるパラメタを推定する
fit.1<-dlmMLE(Nile,parm=c(1,1),build.1)
fit.1
$par
[1] 9.622439 7.291970

$value
[1] 549.6918

$counts
function gradient
29 29

$convergence
[1] 0

$message
[1] "CONVERGENCE: REL_REDUCTION_OF_F <= FACTR*EPSMCH"

　これは実質1行で計算できるので楽ですね。dlmMLE(Nile,parm=c(1,1),build.1)をしてやるだけです。推定するパラメタが二つあるのでparm=c(1,1)という風に二つ初期値をテキトーに入れてやると勝手に計算してくれます。

推定されたパラメタを使ってモデルを組みなおします。太字は私が勝手に入れました。

mod.Nile<-build.1(fit.1$par)
> mod.Nile
$FF
     [,1]
[1,]    1

$V
         [,1]
[1,] 15099.75

$GG
     [,1]
[1,]    1

$W
         [,1]
[1,] 1468.459

$m0
[1] 0

$C0
      [,1]
[1,] 1e+07

　なんだか怪しげなパラメタがたくさん出てきましたが、FFとかGGとかいうのは”推定されたパラメタ”ではありません。モデルの「型」を作るための構成要素です。　今回は説明しませんが、じつはdlmModなんとかっていう関数を使わなくても、このFFだのGGだのを指定してやれば自分で何でも自由にモデルを組むことができます。行列の掛け算とかがわかる方は、参考文献の数式を見るとFFやGGの意味がすぐ分かると思います。今回は省略します。
　とりあえず今回大事なのは　VとW　です。Vは観測誤差の大きさ(分散)を表していて、Wは状態の変動の大きさ（プロセスエラーの分散）です。　Wより Vのほうが大きくて、観測誤差のほうが大きいということがわかります。

Step3　Step2で推定されたパラメタを「型」に入れてカルマンフィルターを回す
NileFilt<-dlmFilter(Nile,mod.Nile)
ここまで来ると後は楽です。一行でカルマンフィルターが完了して、モデルが出来上がりました
dlmFilterにデータであるNileと出来上がったモデルの型mod.Nileを入れればできます。

　 Step4　カルマンフィルターの結果を使ってスムージングする
NileSmooth<-dlmSmooth(NileFilt)
スムージングも一行で完了。dlmSmoothにフィルタリングした結果であるところのNileFiltを入れればできます。

結果
中身は示しませんが、推定された「状態」を表示させるには以下を実行すればよいです。
NileFilt$m # カルマンフィルターで推定された状態
NileSmooth$s # スムージングされた結果

　結果をプロットします。まずはカルマンフィルターの結果です。dropFirstとは一番最初の値を取り除く処理です。なぜこれが必要なのかを説明するとまた1章分くらい文章を消費しちゃうので後回しにします。

plot(Nile,type="o",col=8,ylab="",main="Nile Filtering")
lines(dropFirst(NileFilt$m),col=2,lwd=2)

Nile Filt

次はスムージングした結果です。こっちのほうが滑らかになってますね。
> plot(Nile,type="o",col=8,ylab="",main="Nile Smoothing")
> lines(dropFirst(NileSmooth$s),col=4,lwd=2)

Nile Smooth

　ここで引っ張った線はナイル川の流量の見えない「状態」を表しています。毎年よくわからない観測誤差が入ったモノを私たちは観測しているんだけれども、その見えない流量の水準はいったいいくらかというのを推定したら赤い線とか青い線とかになるわけです。
　で、１９２０年の流量の見えない「状態」を１９２０年までの観測結果から推定したのが赤い線（フィルタリングの結果）で、手持ちの100年間のデータすべてをフルに使って状態を推定したのが青い線（スムージング）の結果となります。

　これでとりあえず状態空間モデルを一通り回すという作業ができたことになります。
　次のページからはこの状態空間モデルの内容をもうちょっと掘り下げていきます。

　バグや誤り等ございましたら、掲示板などにご一報ください。

参考文献

[1] J.J.Fコマンダー、S.Jクープマン　和合肇訳：　状態空間時系列分析入門，２００８

[2] G,Petris　and S Petrone: State Space Models in R, 2011 (Journal of Statistical Software)

[3] G,Petris, S Petrone, P Campagnoli: Dynamic Linear Models with R, ２００９

前のページ　⇒　状態空間モデル　へ
次のページ　⇒　ローカルレベルモデル　　へ

Rな予測

Information

ホームページ製作ホームページ素材サーバーランキング FX ＨＰ素材

ｄｌｍの使い方

状態空間モデル推定の流れ

Step 1状態空間モデルの「型」を決める

Step 2パラメタを推定する 最尤法

Step 3 カルマンフィルターする

Step 4 スムージングする

実践 ｄｌｍ

Rな予測

Information

　ｄｌｍの使い方

Step 2パラメタを推定する　最尤法

Step 3　カルマンフィルターする

Step 4　スムージングする

実践　ｄｌｍ