トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

回帰分析

回帰分析は、Y(目的変数)とX(説明変数)の関係を、式で表現する方法です。 Yは量的変数を扱います。

回帰分析は、 多変量解析 の中で、もっとも使われている方法ではないかと思います。 また、もっともわかりやすいと思いますし、ここから始めると他の手法も理解しやすくなります。 時系列解析 等、応用も豊富です。

単回帰分析 は、 重回帰分析 の一番シンプルな形、つまり、Xがひとつしかない2変量の解析です。 勉強の順番としては、2変量の場合をしっかり押さえてからの方が、 重回帰分析 で失敗をしにくくなります。

回帰分析の限界

「XとYの関係を表現したい。」、「XからYを予測したい。」、といった事は、何かの形でデータに関わっていれば、 誰しも思うところではないかと思います。 そして、回帰式のようなものを、自己流で考えることもあると思います。

そうしたところに、「最小二乗法で回帰式の係数を求める。」なんて話を聞くと、「これだ!」と思うのではないでしょうか? (筆者はそうでした。。。)

しかし、回帰分析は万能ではありません。 二次の項を入れたり、対数に変換したり、回帰分析の発展形を使ったり、といった工夫で解決することもありますが、 それらを使ってもうまくいかない事はたくさんあります。

回帰分析が得意なのは、静的な(時間に依存しないとみなせる)現象で、 YとXの 線形性 を解析する場合です。 動的な現象の解析は、 経時解析 (Yと時間の関係の解析)や、 自己相関分析 (現在のYと、過去のYの関係の解析)、 丁寧に 層別 した解析で、うまく行く時があります。

「XとYの関係を表現したい。」、「XからYを予測したい。」というニーズに対しては、 データマイニング 等の数理や、 メタ知識 を駆使していくことも大事です。 メタ知識としては、起きている現象の数理をあらかじめ考えておくことが有効です。 物理的な現象なら、例えば、「Yは、対数の形にしておいた方が良い」や、「Xは、逆数を使った方が良い」、 ということを検討しておいて、それをモデル式を作る時に活かします。



統計モデルによる仮説の探索

足し算モデルと割り算モデル


順路 次は 散布図と相関性

Tweet