田口善弘@中央大学:統計の場合、なんらかの確率を考えてそれでいろんな判断をします。例えば「検定」というのは背理法のように「もし、ある仮定が正しいとすると、今目の前に起きていることが偶然起きる確率はどれくらいか?」と考えて、その確率がすごく小さかったら「こんなこと偶然で起きないから仮定は間違っているな」という風に考えます。ベイズ統計というものではなんらかのモデルをかんがえて「このモデルが正しいとするともっとも生じやすいのはどんな時かな?」と考えます。一方、機械学習の場合、いまあるデータのもとに何かを予測したりしますが、その予測がどれくらいの確率で起きるかは必ずしも説明されません。例えば、機械学習で顔認証をする場合、カメラに映った映像が本人か本人じゃないかは判断してくれますが、本人であるという確率がどれくらいか、というようなことは必ずしも教えてくれません(確率をおしえてくれるような機械学習もあることはあります)。 統計と機械学習が紛らわしいのは同じことをするのに統計でも機械学習でもできることがあるからです。「明日の天気は晴れか雨か?」という問題を考えるのに、統計を使えば「晴れと雨とどっちが確率が大きいか」という考察を経て予測を決めますが、機械学習だと過去の様々なデータを使って明日の天気を予測できるように学習を行ってから予測します。どっちも「明日の天気を予測する」というのは同じなので、違いがわかりにくくなってしまうのです。(Read more)
須山敦志 Suyama Atsushi:実用上ではあまり違いを気にしなくてよいのではないでしょうか。各々の分野としての源流やコミュニティには違いがありますが、機械学習の方はそもそも人間の知能をコンピュータで実現したいというモチベーションからスタートしているため、データに対する示唆出しを重視する統計学よりも、与えられたタスク(予測できるか、など)へのパフォーマンスやアルゴリズムの挙動が評価対象になる傾向が強いのではないかと思います。(Read more)
浅野 晃:すでにいくつか回答が出ていますが,私は自分が担当している「統計学」の講義の最初に,こんなふうに説明しています。 == 最近話題の「機械学習」も,統計学の一種です。ただし,人間ではなくコンピュータのための統計学です。 伝統的な統計学は「データから情報を『人間が理解できる形で』導き出す」ものですが,機械学習は「コンピュータが利用できる形」でしか導き出しません。囲碁や将棋で,コンピュータはいちばん強い人間よりも強くなっていますが,コンピュータは「なぜその手を指したのか」を人間にわかる形では教えてくれません。 私の「統計学」のクラスでは,データを人が理解するための「伝統的な統計学」を説明します。 == よく「工学と理学の違いは,工学は『どうやって動かすか』を考える,理学は『なぜ動くか』を考える」といわれます。機械学習は「なぜできるのかはわからなくてもいいから,将棋に勝ったり,外国語を翻訳したり,絵を生成したり,ができればいい」という「工学」の立場で,統計学は「データから得られる情報がどうやってできているのか,どういうモデルが立てられるのかが知りたい」という「理学」の立場,ということができるかもしれません。(Read more)
ドリチン:専門的な方が回答されているので私からは両方の言葉の意味から簡単に自分の解釈をご説明させていただければと思います。 機械学習...経験からの学習により自動で改善するコンピューターアルゴリズムもしくはその研究領域で、人工知能の一種であるとみなされている。「訓練データ」もしくは「学習データ」と呼ばれるデータを使って学習し、学習結果を使って何らかのタスクをこなす。 統計...経験的に得られたバラツキのあるデータから、応用数学の手法を用いて数値上の性質や規則性あるいは不規則性を見いだす。統計的手法は、実験計画、データの要約や解釈を行う上での根拠を提供するため、幅広い分野で応用されている。 個人的に、統計はデータを知ることを目的として数学的知識を使っている学問だと思います。それに対して機械学習とは統計学を基礎としてデータの「予測」を行うことを目的していると思います。つまり、機械学習の前提に統計学がある、といった説明になると思います。(Read more)