因果推論とは
因果推論って何?
因果推論とは
因果推論とは、モノの因果序列を統計的に推定し、因果的にあるべき集合体を解く計的に推測していることである。
これを読んだだけでは何のことかわからない人が多いだろう。
それほど専門的で難しい話になる。
しかし統計学の道ではこれを理解しないことには何も始まらないともいわれているのである。
因果関係とは
まずは因果関係を説明していく。
因果関係とは「AをしたからBがおきた」ということである。
例えば、ある塾でテスト対策を受けたAさん。
直後のテストではAさんの成績は向上した。
しかしこのとき、本当にテスト対策を受けたからAさんのテストの結果が向上したかどうかわからない。
テスト対策の効果を証明するためには
・「テスト対策を受けていない場合のAさんの成績」
・「テスト対策を受けたときのAさんの成績」
の両方を観測する必要がある。
もしこれらの成績が同じであれば、テスト対策をしたから成績が向上したわけではないということになるのである。
しかし、もうお分かりだと思うが、この2つを同時に観測することは不可能なのである。
そのため、テスト対策とAさんのテスト結果の因果関係を知ることはできないのである。
集団への因果関係
ではAさん1人だけではなく、テスト対策を受けた人、テスト対策を受けなかった人をそれぞれ観察してみれば、テスト対策とテスト結果についての因果関係がわかるのではないだろうか。
・テスト対策を受けたn人のテストの平均点
・テスト対策を受けなかったm人のテスト結果の平均点
これらを比較して、テスト対策を受けた人の平均点のほうが高ければ、テスト対策とテスト結果の因果関係を知ることができるはずであろう。
しかしそう簡単にはいかない。
n人の結果とm人の結果に差があったとしても、それがテスト対策による結果なのか、それともn人とm人のグループ間の性質の違いによるものなのかは不明なのである。
ここでも因果関係を知りたければ、
・テスト対策を受けたn人の平均点
・テスト対策を受けなかったn人の平均点
が必要になる。
つまり、テスト対策を受けたn人がテスト対策を受けなかったときの結果を観測することができなければ因果関係は知ることはできないのである。
反事実
ではどうやって因果関係を証明するのか。
ここで登場するのが「反事実」である。
先ほどの例を使って説明しよう。
n人がテスト対策を受け、m人はテスト対策を受けなかった。
このとき、結果を以下の4つに分類する。
1、n人がテスト対策を受けたときの結果
2、n人がテスト対策を受けなかったときの結果
3、m人がテスト対策を受けたときの結果
4、m人がテスト対策を受けなかったときの結果
実際に観測できるのは1と4だけであるのはお分かりいただけると思う。
しかし因果関係を証明するために必要なのは1と2の結果なのである。
しかし2は「反事実的な現象」であり、観測するのは不可能なのは先ほど説明した通りである。
無作為化
しかし、反事実を疑似的に観測することは可能である。
2の結果を、観測できる4のデータを用いて擬似的に観測するのである。
1と4で差が出るのは、テスト対策によるものなのか、グループの特性によるものなのかはわからない。
ならばグループの特性をほとんど同一のものにしてしまえば、1と4に差が出たときにテスト対策によるものであると推測ができるはずである。
「テスト対策を受ける人」と「テスト対策を受けない人」のグループ分けを「無作為化」という手法を使って行う。
コイントスなどを使って2つのグループに分けていくのである。
こうすることでグループ間の差はなくなる。
そうはならないだろうと思った方もいるかもしれないが、実際にテストの点数の期待値を出してみると、グループ間にほとんど差が出ないことがわかるはずだ。
そうすると、観測可能な4の結果が2の結果としても使うことができるのである。
そして1の結果と擬似的に出した2の結果を比較することで因果関係を推測することができる。
これが因果推論である。
「ワードサーチ」は日常雑学・各種専門用語や業界用語などの意味を初心者にも分かる様に解説している用語集サイトです。
IT用語、お金・投資用語、ビジネス用語、日常雑学用語等を調べる際にご活用くださいませ。