統計的学習・最適化(集団の知恵を生かす研究)

No Image

 研究テーマに書かれている統計的学習とは、多くのデータから規則性を見つけ、そのデータを生じさせる構造を探ることです。私の研究室ではこの問題を数学的な形で定式化して、一般的に構造を探る方法を研究しています。

 例えば、40人の高校クラスで数学のテストをすると色々な点数が現れます。そしてこの点数の差を説明したいと思います。そこで他のデータ、例えば自宅での学習時間のデータがあったとします。個々の生徒に対して数学テストの点数と学習時間のデータがあることになります。そこで横軸学習時間、縦軸はテスト点数とすれば2次元平面に40個のデータ点が描けます。どんな点の分布が考えられますか。学習時間が増えると点数が上がりそうですね。つまり学習時間で点数が説明できそうですね。

 これは簡単な例で原因と結果の関係が明確ですが、実際のデータでは原因と結果の関係を見つけることが問題になります。つまり学習とは原因と結果の構造を見つけることです。そしてすでに存在しているデータを利用することが「集団の知恵を生かす」ことの意味です。この考えは最適化問題にも適用できます。最適化とは与えられた関数の最大値を求める問題ですが、変数の数が多いと大変難しい問題です。最適化問題で過去に出ていた関数の値から変数の値と関数の値の関係を先ほどの例のように調べて構造を推定して最適化問題を解く方法を研究しています。