これから所謂データサイエンスを学んだり仕事で活用したりしようと考えている者です。「所謂」と書いたのは、巷間言われている同分野があたかも統計学と同義であるかのように解説されているからです。例えば既存のデータに対して最もFitの良い関数を推計する場合、データが時系列ではなくクロスセ…

これから所謂データサイエンスを学んだり仕事で活用したりしようと考えている者です。「所謂」と書いたのは、巷間言われている同分野があたかも統計学と同義であるかのように解説されているからです。例えば既存のデータに対して最もFitの良い関数を推計する場合、データが時系列ではなくクロスセクションであった場合などは不均一分散が発生するため最小二乗法よりもプロビットやロジットなどの最尤法を使うことで解決できますが、それでもこれは統計学の範疇です。そこで質問です。

（1）上記のようなケースや、或いはそれに限らずFitの良い関数を推計するテクニックとして、統計学ではなく近似理論（数値解析法の一分野）の、例えばLagrange function、Newton's/Hermite interpolation formula（Divided difference）、Bernstein Operator、Minimax approximation (Characterization Theorem）、Least squares approximation、或いは周期関数ならフーリエ近似などのテクニックは所謂データサイエンスにおいて使わないものなのでしょうか？これらはあくまでも閥値内での近似に過ぎないからダメということなのでしょうか？

（2）個人的なバックグラウンドを背景とした質問になるのですが、私は統計学に関しては大学の学部時代に計量経済学を割と真面目にゼミで勉強し、就職してからもファイナンス関連で細々と触ってはいました。一方、40代になってから英国の大学院で数学の修士号を取得しました（ヘボい大学です）が、その時は統計学は全く触らず、上記のApproxmation theory（教科書はM.J.D. PowellのApproxmation theory and methods）や、そのほかは

Algebraic graph theory（教科書はGodsil and Royleの同名書）、

Calculus of variations、

Analytic Number Theory（教科書はApostol）、

Nonlinear ordinary differential equations（教科書はJordan and Smith）、

Coding theory and cryptography 、などです。

ヘボい大学（英国の）ですが、Distinctionで数学の修士号を取得しました。

この学力で、40代後半で、いまさらデータサイエンティストなんてやれるのでしょうか？

TJO