田口善弘@中央大学:統計の場合、なんらかの確率を考えてそれでいろんな判断をします。例えば「検定」というのは背理法のように「もし、ある仮定が正しいとすると、今目の前に起きていることが偶然起きる確率はどれくらいか?」と考えて、その確率がすごく小さかったら「こんなこと偶然で起きないから仮定は間違っているな」という風に考えます。ベイズ統計というものではなんらかのモデルをかんがえて「このモデルが正しいとするともっとも生じやすいのはどんな時かな?」と考えます。一方、機械学習の場合、いまあるデータのもとに何かを予測したりしますが、その予測がどれくらいの確率で起きるかは必ずしも説明されません。例えば、機械学習で顔認証をする場合、カメラに映った映像が本人か本人じゃないかは判断してくれますが、本人であるという確率がどれくらいか、というようなことは必ずしも教えてくれません(確率をおしえてくれるような機械学習もあることはあります)。
統計と機械学習が紛らわしいのは同じことをするのに統計でも機械学習でもできることがあるからです。「明日の天気は晴れか雨か?」という問題を考えるのに、統計を使えば「晴れと雨とどっちが確率が大きいか」という考察を経て予測を決めますが、機械学習だと過去の様々なデータを使って明日の天気を予測できるように学習を行ってから予測します。どっちも「明日の天気を予測する」というのは同じなので、違いがわかりにくくなってしまうのです。