← その1(/4)へ

↑百問百答目次へ → その3(/4)へ

§2 スペクトル解析一般

§§2−2 スペクトル解析(その2)
§§§2-2-1 AR vs MEM

問 MemCalcでは,どのスペクトル解析法を用いているのですか?またそれを選んだ理由は何ですか?

0560

答 MemCalcでは,最大エントロピー法(MEM)を用いています.MemCalcでMEMを用いている理由の一つは,表0550にあるように,MEMは短いデータの解析(与えられたデータ以外のデータを必要としない),そして分解能に優れているからです.MEMは,バ−グ(Burg)によってスペクトル解析法として確立されました.しかしながら,バ−グによってもたらされたアルゴリズムを忠実にコンピュ−タ・プログラムとして実現することは,MemCalc以前には十分成功していたとは思われません.MemCalcでは従来のMEMにあった困難が克服されており,MEMの優れた特質が初めて発揮されたと言っていいでしょう.

問 MemCalcではどのように従来のMEMの困難を克服しているのですか?

0570

答 従来のMEMではスペクトル公式やそれを導く過程にAR法による定式化と重なる部分が存在しており,MEMの本格的活用はAR法の限界によって大きく損なわれてきました.その最も大きな点は,AR法によるラグ値(多くの場合,非常に小さな値になる)を用いなければならないという間違った見解がまかり通ったためです.MemCalcでは,MEMは本来AR法の限界によって拘束を受けるものではないという新しい見解を採用し,ラグ値を可能な限り大きくするという大胆な方法を採用しました.実はこのことによって,従来のMEMの限界を見事に克服できたのです.

問 MEMとはどういうものですか?

0580

答 MEMは,統計物理学の基礎理論としてジェインズ(Jaynes)によって提起された“最大エントロピ−原理(ME原理 maximum entropy principle)”に基づくスペクトル推定法です.即ち,MEMの依って立つ理論的基礎は,統計物理学における基礎理論としてのME原理にあります.ME原理は,情報エントロピ−の普遍的性質に基づく普遍原理であって,仮説ではないと言われています.そしてこのME原理は,統計物理学を,その最も基本的な仮説である“先験的等確率の原理”から解放しました.

問 AR法とはどういうものですか,また“AR法の限界”とはどのようなものですか?

0590

答 AR法の限界には,大きく分けて次の2つがあります.

@時系列のモデルの中で,時系列の“ゆらぎ”を白色雑音で表現している.
A実際的利用の局面で,最適ラグ値の選定に厳しい制約が存在する.

以下では,@とAについて,順に説明します.

@“AR法は,時系列のモデルの中で,"ゆらぎ"を白色雑音で表現している”ことについて

 AR法の起源は,ユ−ル(Yule)が太陽黒点数の変動解析に対して,不規則な雑音を伴う振動子モデルを考えたことに始まります.このモデルは2次の差分方程式

   xn + a1 xn1 + a2 xn2 = εn 

で記述され,今日の自己回帰(AR)モデルの原型になりました.これは2次のARモデルであり,現時点の値 xn が,2つ前までの時刻の値 xn1xn2および現時刻に加わる白色雑音(white noise) εn の線形結合によって表現されています.それゆえ,ARモデルでは,現時点の値を過去の時点の値の線形結合で表現した上で尚表現仕切れない部分(例えば,非線形部分)を,白色雑音で補っていると考えても良いでしょう.即ち,時系列の“ゆらぎ”を,白色雑音と仮定していることになります.しかし,時系列の“ゆらぎ”は,厳密には非線形効果を含むものです.非線形部分を白色雑音で補うなどということは,時系列の本質に関わる厳しい拘束を課すものであり,時系列モデルとしては任意の時系列に成り立つような一般的・普遍的な条件ではあり得ません.特に,自己相似的構造を本質とする時系列はAR過程ではあり得ませんので,AR法を自己相似的な時系列に適用することはできません.

A“実際的利用の局面で,最適ラグ値の選定に厳しい制約が存在する”ことについて

 AR法のラグ値(次数)は,最終予測誤差(FPE:final prediction error)などの情報量規準(information criteria)の最小化条件を満たす値として選定されます.こうして選定されるラグ値は一般に極めて小さい値になるし,最小化条件が適用できない時系列にもたびたび出会います.AR法では,小さいラグ値となってしまうために,スペクトル分解能は著しく低下し,時系列の周期構造を決定できません.このために,自己相似的構造を本質とする時系列の解析には限界があります.即ち,大きな時間スケ−ルの“基底変動”を取り出すことが出来ないため,時系列の多重周期構造を解明できません.

問 AR法のモデルの限界を示す例はありますか?

0600

答 Barnes らは,ARMA(自己回帰移動平均 autoregressive moving average)モデル(ARモデルとMA(移動平均 moving average)モデルを組み合わせたモデル)に基づいて,太陽黒点数の変動の6000年にわたるシミュレ−ションを報告しています.ARMAモデルは,ARモデルに過去の誤差(ラグ付き誤差)を含めるというモデルです.過去の誤差は観測されないので白色雑音として扱います.こうしたMAモデルとARモデルとの結合によって,現実の時系列デ−タの解析にARモデルと比べてどのような前進をもたらしているかはそれほど明らかにはなっていません.ARモデルには,この他にARIMA(自己回帰和分移動平均 autoregressive integrated-moving)モデルと言った更に技巧的なモデルがありますが,どの時系列にどのモデルが適切であるかを判定することは非常に難しい問題です.総じて言えば,ARモデルの妥当性は現実の時系列をどの程度説明できるかにかかっていますが,この点では一貫して様々な疑問が生じています.時系列解析方法が現実の時系列をどの程度説明できるかという点は,理論的展開や興味以上の,時系列解析方法の真価を判定する最も重要な基準です.
 さて,BarnesらのARMAモデルによる太陽黒点数の変動の6000年にわたるシミュレ−ションですが,図0600(b-1)にその結果を示します.この結果と実際の観測された時系列(図0600(a-1))とを比べると,マウンダ−極小期も見えるし,全体の変動も一見類似しているように見えます.また,このARMAモデルによる時系列を用いてMemCalcによって計算されたPSD(図0600(b-2))は,実際の時系列についてMemCalcによって求められたPSD(図0600(a-2))と極めて良く類似しています.ARMAモデルによって発生させた時系列をARMAモデルでPSDを求めると,AR法と同じラグ値の問題からこのようなスペクトルにはならず,元々比較の対象にはりません.両者のPSDから得られた周期値が表0600に比較されています.確かにかなりよく対応しています.
 ところが,両者のPSDには,決定的な差異があります.それは,PSDを両対数表示(図0600(a-3)および0600(b-3))することによって明瞭に示すことができます.即ち,実際の時系列のPSDの傾きは1/f に近いのに対して,ARMAモデルによる時系列は1/f 2 になっています.スペクトルの傾きの違いは,実際の太陽黒点数の時系列の“ゆらぎ”との違いを示すものであり,ARMAモデルの妥当性に重大な疑念がでることになります.

図0600 太陽黒点数データについてのARMAモデルによるシュミレーションの評価.

 

表0600 MemCalcよる周期値とARMAモデルによる周期値の比較.   

MemCalc

FFT
265.16 175.0 
107.11 111.7 
50.41 71.2 
12.79 49.9 
11.04 11.7 
10.04 11.2

問 よくMEMとAR(自己回帰モデル)は同じであるといわれますが,その点についはどうですか?

0610

答 ARをもっぱらとする研究者はARの範疇でMEMを理解しようとする傾向が強いようです.しかしながら,MEMとARは別のものであるとするのが正しい解釈です.今後,多くの研究者にMEMが広く利用されるに従って,そのような理解が急速に進むと考えられます.
 両者を別物であるとする第一の根拠は,MEMは最大エントロピー原理という普遍原理に直接依拠する他は,対象系に関してなんらのモデルを想定していないことです.それに対してARは,あくまでも対象系をいわゆるARモデルという単純な線形モデルで記述できるという前提のもとで構築された理論体系です.例えばカオス時系列データ,それは非線形システムからの出力ですが,その種のデータを扱う上でMEMはなんら制約をうけませんが,他方,ARはその理論体系の前提が線形モデルですから,その種のデータの解析には使えないことになります.
 カオス時系列データの取り扱いに関するこの違いは,むしろARにおいて深刻です.なぜならば最近のカオスに関する研究の結果,生体時系列データや経済データなど,多くの実際上興味あるデータのほとんどがカオス時系列データである可能性が高いことが認識されつつあるからです.このことは,これらのデータに関してこれまで蓄積されてきたARによる研究のほとんどすべてが(ARを使ったというだけで)再検討されねばならないからです.

問 多くの解説書ではARの理論体系のなかでMEMスペクトルを扱っています.ARの理論体系を離れてMEMスペクトルを導出するまでの体系を構築できるのでしょうか?

0620

答 もともとMEMに関するBurgによる最初の研究では,ARモデルとはまったく無関係に理論が構成されていました.また,MEMに関する研究の当時の集大成であるD.G.Childers編"Modern Spectrum Analysis"(1978)に掲載されている数々の論文では,MEMスペクトルの扱いはAR流のそれとまったく異なり,結果としてMEMとARは別物であると著者らが考えていることがよく読み取れますし,ARにまったく関係無くMEMスペクトルを導出するまでの理論の流れが記されています.
 そもそもMEMがARと同じであるという主張はARの研究者によりなされたものにすぎません.ARは極めて単純な線形モデルであり理解しやすく,それだけに理論も現実の時系列データの複雑さを離れて一見“精緻”に展開することができ,そのようなところが広く受け入れられて広まったという経緯があります.このような歴史的展開のなかで両者を同一視する見解がなされてきたと思われます.

問 MEMとARではスペクトルの計算の際に同じ式を使います.その点からすると,やはり両者は同じなのではないですか?

0630

答 MEMの理論体系,具体的にそのスペクトル計算のための手続きは現実に存在するすべての時系列データについて(エルゴード性の仮定は通常どおり成立するとして)適用可能です.一方,ARは線形モデルについてのみ成立する理論です.より汎用なMEMの理論体系がより限定されたARの状況においても成立することは,MEMの理論体系の方が一般に成立することを示すものです.
 その上で,AR流の限定された状況においてスペクトルを計算する際には,情報量規準の示すラグの制約を逃れることはできません.具体的に,時系列データをAR流に捉えた場合には例えばFPEのfirst minumumにラグを設定してスペクトルを計算することが理論的整合性から要求されます.しかしながら,MEMの方法にはそうしたラグの制約は本質的に存在しません.

問 ARでは各種情報量規準(FPE,AIC,CAT)を用いてスペクトル計算の際のラグを決定し,従って与えられた時系列データについて唯一のスペクトルを得ることができます.MEMではどうなりますか?

0640

答 唯一のスペクトルを決めるためには,連続的に測定された無限長のデータが必要です.このことは即ち,(離散的に測定された)有限長のデータ,与えられた現実の時系列データのみを用いて唯一のスペクトルを求めることは本来不可能であることを意味します.
 ところで,ARでは時系列データがARモデルに従うことを仮定しています.即ち,時系列データに特別の構造をあらかじめ仮定してしまうのです.そして,この制約のもとではじめて情報量規準を適用することができ,ラグがひととおりに決まり,従って“唯一のスペクトル”が求まるということになります.
 他方,MEMでは時系列データにそのような構造を仮定しません.従ってラグを唯一に決めることができず,結局“唯一のスペクトル”を求めることはできません.(離散的に測定された)有限長のデータからはそのスペクトルを一通りに決めることはできないというあたりまえのことが理論構成上,そっくりそのまま保存されています.
 逆に,ラグをどのようにとってもよいのがMEMです.ラグを変化させるとスペクトルも一見,変化しますが,その変化は決してでたらめなものではなく,保存されるべき特徴を保存したうえで,ラグを大きくすると時系列データのより詳細な構造をスペクトルに反映する,そのような方法で変化がおきます.

問 ARではラグの値はどのような意味をもちますか?

0650

答 ARの場合,ラグの値は時系列データを発生したシステムの構造そのものに直結しています.例えばラグの値が2(=2次のAR過程)であるとは,観測値が1つ前と2つ前の観測値によってのみ決まる,そのような構造を持つものとして対象系を理解するということです.一方,MEMのラグ値は,スペクトルの分解能との関係で時系列を見る見方(窓)です.

問 一口にARモデルと言ってもいろいろとあるのではありませんか?

0660

答 ARMA,ARIMAなど,“画期的なモデル”とされる一群のモデルがあります.しかしながら,いずれも線形モデルという点では大差無く,しかもどの時系列データに対してどのモデルを適用すべきかという一意的な基準がありません.一方,“カオス”に関する最近の研究の示すところによれば,生体データ,経済データをはじめ,私たちが現実に出会うほとんどのデータは非線形システムからの出力です.カオス時系列データをARモデルで解析し得ないことは明らかです.

問 ラグの設定に関して,AR流のラグの値と異なる設定を提起,または実行している例を知りたいのですが.

0670

答 ロヴェリとブルピアニ(Rovelli&Vulpiani, 1983)は,種々の地球物理学時系列データに対して,いくつかのラグ値 M を用いることによって得られるPSDの振る舞いを報告しました.図0670に,彼らによって報告されたPSDを,データの全長N の10, 20,..., 80%に等しいラグに対応させて示します.彼らは,通常の規準(FPE, AICおよびCAT)によって与えられるMの値(Nの数%に等しい)を報告し,更に新しい規準としてCCTを導入し,CCTによるMの値がNの数10%になることを報告しました.彼らは,例えば太陽黒点数については,204標本点について,FPE, AICおよびCAT規準から,それぞれ,M = 8, 3および9を報告し,パドマナビャンとラオ(Padmanabhan & Rao)は,また,316標本点のデータについてM = 9を報告しました.
 私たちの研究では,FPE, AICおよびCAT規準を最小にする値は,13であることが得られましたが,これらの値は,明らかに小さすぎると言えます.というのは,M のこれらの値を用いる MEMによって評価された周期セットが,原時系列の振動を決して再現しないからです.ロヴェリとブルピアニは,彼らによって提案されたCCT規準に基づいて,M = 65 を選定し,幾つかの周期を得ましたが.彼らのMEMによって評価された周期は,太陽黒点数の周期性を十分に再現していません.私たちは,MEMによる評価周期のラグ依存性の研究に基づいて,M 値を決定し,結果として得られたMの値は,292標本点のデータについて164でした(参考文献2-1).この値は,今までに報告された全てのM 値の中で最大であり,この値を用いることによって,元の太陽黒点数の変動が十分に再現されました.

図0670 これまでのMEM-PSD.

問 「ARでは与えられた時系列データのスペクトルを求めるのではなく,その時系列データの属する母集団のスペクトルを求めているのであるから,ラグが小さくてよい.逆にラグを大きくするとその時系列データにのみ固有のスペクトルを求めることになり,いわゆる過剰あてはめの状態となり不適切だ.」との指摘を受けました.

0680

答 スペクトルピークから原時系列データを構成するモードを取りだし,その複数モードにより解析函数として原時系列データの挙動を説明するというMemCalcシステムでは,ラグを大きくとって時系列データに固有のリズムをスペクトルのピークとして取り出すことが必要です.この一連の手続きがAR流に解釈すると「過剰あてはめで意味がない」ということになるようです.
 ここで,この“過剰あてはめ”という議論の根拠には,ARでは例えばFPE等の情報量規準のfirst minimumにラグをとることによって,与えられた原時系列データから母集団のスペクトルを“推定”しており,この母集団についての情報こそが意味を持つという展開があります.
 しかしながら,現実の時系列データの取り扱いにおいて,このARの流儀はしばしば破綻します.次の図は1拍の間の血圧の変動(脈圧変動)の解析結果で(a)が原データ,(b)がMemCalcシステムによるスペクトル,(d)がAR流にラグをとったときのスペクトルです.それぞれのスペクトルピークとして見いだされたモードを用いて原時系列データにあてはめを行った結果が(c)と(e)で前者がMemCalcシステムによるもの,後者がAR流の取り扱いによるものです.
 AR流の理解によれば(a)の原時系列データの母集団のスペクトルが(d),従って(e)のあてはめ曲線が母集団を代表する時系列データということになります.しかしながら,1日で約10万拍におよぶ拍動に対応して脈圧変動を子細に観察しても,およそARが母集団を代表するとしている(e)のような脈圧変動は1拍として見いだされません.また,10万拍分の脈圧変動を足し込んでも,(e)のようなパターンにはなりません.ここでは,ARはありもしない母集団を想定していることになります.

図0680 一拍の脈波(a),MemCalcによる解析結果((b),(c))とARによるそれ((d),(e))の比較.64点の脈波データをラグを最大にしてMemCalcで解析してスペクトル(b)を得た.また,FPEのfirst minimumにラグを設定してAR流のスペクトル(d)を得た.(c)と(e)は各スペクトルピーク周波数からMemCalcの方法によって得た曲線.

 


↑ページの先頭へ

← その1(/4)へ

↑百問百答目次へ → その3(/4)へ