トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

回帰分析

回帰分析は、Y(目的変数)とX(説明変数)の関係を、式で表現する方法です。 Yは量的変数を扱います。

回帰分析は、 多変量解析 の中で、もっとも使われている方法ではないかと思います。 また、もっともわかりやすいと思いますし、ここから始めると他の手法も理解しやすくなります。 時系列解析 等、応用も豊富です。

単回帰分析 は、 重回帰分析 の一番シンプルな形、つまり、Xがひとつしかない2変量の解析です。 勉強の順番としては、2変量の場合をしっかり押さえてからの方が、 重回帰分析 で失敗をしにくくなります。

回帰分析の限界

「XとYの関係を表現したい。」、「XからYを予測したい。」、といった事は、何かの形でデータに関わっていれば、 誰しも思うところではないかと思います。 そして、回帰式のようなものを、自己流で考えることもあると思います。

そうしたところに、「最小二乗法で回帰式の係数を求める。」なんて話を聞くと、「これだ!」と思うのではないでしょうか? (筆者はそうでした。。。)

しかし、回帰分析は万能ではありません。 二次の項を入れたり、対数に変換したり、回帰分析の発展形を使ったり、といった工夫で解決することもありますが、 それらを使ってもうまくいかない事はたくさんあります。

回帰分析が得意なのは、静的な(時間に依存しないとみなせる)現象で、 YとXの 線形性 を解析する場合です。 動的な現象の解析は、 経時解析 (Yと時間の関係の解析)や、 自己相関分析 (現在のYと、過去のYの関係の解析)、 丁寧に 層別 した解析で、うまく行く時があります。

「XとYの関係を表現したい。」、「XからYを予測したい。」というニーズに対しては、 データマイニング 等の数理や、 メタ知識 を駆使していくことも大事です。 メタ知識としては、起きている現象の数理をあらかじめ考えておくことが有効です。 物理的な現象なら、例えば、「Yは、対数の形にしておいた方が良い」や、「Xは、逆数を使った方が良い」、 ということを検討しておいて、それをモデル式を作る時に活かします。



統計モデルによる仮説の探索

足し算モデルと割り算モデル


参考文献

データ解析のための統計モデリング入門 一般化線形モデル・階層ベイズモデル・MCMC」 久保拓弥 著 岩波書店 2012
ポアソン回帰からスタートして、GLM(一般化線形モデル)を解説しています。
そして、現実のデータには何らかの個体差があるのでGLMが使えるのは限定的、として、 GLMM(一般化線形混合モデル)の話になり、 階層ベイズモデル の話につながります。
Rの例も多いです。
この本の著者は、 生態学 の方です。 どうやら生態学の立場で、ベースになるモデリングとなるのが、この本の内容のようです。
ネットや別の本の中で、この本が データサイエンス の教科書のように紹介されているのを見たことがあります。
その理由は、 マーケティング・サイエンス での人の志向や行動の分析は、生態学とアプローチが近いためではないか、と思います。


ランク回帰と冗長性分析」 齊藤堯幸 著 森北出版 2002
縮小ランク回帰・合成変量による多変量回帰・計量心理学の冗長性分析を扱っている本です。 どうやら、 回帰分析 や、 主成分分析 の応用のようです。
これらの手法の事例が、植生と土壌の関係や、服の感触の解析や、臭気の調査なので、 このサイトの 農産物の貿易 や、 環境生理学 と関係していました。 手法の内容がわからないのですが、結論を見る限り、「この手法ならでは」という感じがしないです。 手法の威力がわからないでいます。



順路 次は 散布図と相関性

Tweet