橋本 省二:実験はすべての条件をそろえておかないと意味がない。先生にずいぶん厳しく言われたものです。物理学でなくても、ほら、種が発芽する条件を調べるのに他の条件をそろえた上で例えば水分が必要かどうか調べる。小学校でやりましたよね。ところが、条件をそろえるのが不可能な事態が世の中にはいくらでもあります。おっしゃるとおり医学や経済はそういう分野ですね。薬が効くかどうかを同じ人に対して同時に実験はできない。値下げで売り上げが増えるかどうかはやってみるまでわからない。そんなときどうすればいいか。統計的因果推論というのは、そういう難しい問題をどうにかしようという試みだと理解しています。 いろんな条件がそろわないときにどうすればいいか。逆に、似てるけど少しずつ条件の異なるサンプルを数多くランダムに集めて、それらを同時にフィットしてはどうか。いろんな町、いろんな季節での売り上げデータとかですかね。条件の違いはパラメターとして取り入れる。関係なさそうな条件も含めていろんなパラメターを入れておく。それらの間にはいろんな相関もあるだろう。深層学習を使えば、そういうのもすべて込みでフィットすることができる。そうした準備をしたうえで、当店で値下げした効果を推定する。売り上げが増えるか減るか。100%当たらないとしてもある程度よい評価ができるのではないか。まったくの部外者の物理学者が想像する因果推論とはこういうものです。(違ってたらごめんなさい。) 物理学者としては、こういうあいまいな仮想実験は勘弁していただきたい。正しいかどうかわからないではないか。その結果から何を結論できるというのか。それがまず言いたくなることです。機械学習全般に対しても同じ感想をもちます。結果が正しいかどうかわからないものに全面的に依存するわけにはいかない。ただし、少々間違ってもいい場面というのもありますから、そこをわかってやっている分には問題ないのですが。 本題に戻りましょう。物理学者は確実に答えを出せる問題しか考えないということかもしれません。お前だけだと言われそうな気がしますが、経済の問題にくらべれば考慮すべき要素が圧倒的に少ないのは明らかです。何しろ何を考えているかわからないヒトの行動を考える必要がないんですから。そこまでいかなくても、変数を少し増やしただけで手におえなくなる問題はいっぱいあります。カオスとかそうですよね。南米のチョウが羽ばたいたおかげで日本に台風がくるか、そんな問題を調べようったって無理というものです。こんなときこそ因果推論、と言いたいところですが、ここまで変数の多い問題ではどうしようもないでしょうね。行ったり来たりしてしまいますが、それなりに複雑で、でも複雑すぎず、少々間違えても困らないような問題があったら使える可能性はあると思います。というか、もうどこかでやられてるんじゃないでしょうか。(Read more)