データから有用な情報を取り出すための方法論である統計科学についてテーマを選んで講義を行う。特に情報量規準によるモデル選択やブートストラップ法など,計算機を多用する手法についてその数理的側面と現実の応用を紹介する。
データから有用な情報を取り出すための方法論である統計科学についてテーマを選んで講義を
行う.特にコンピュータを多用する現代の統計手法(モデル選択法,ブートストラップ法)を
取り上げる.コンピュータやソフトウエア等の説明ではなく,数理的側面の解説と応用例(住
宅価格データ分析,進化系統樹推定)の紹介である.
1. 統計的モデル選択
1.1 住宅価格データ,1.2 回帰係数の検定,1.3 確率モデルと最尤法,1.4 アミノ酸配列データ,1.5 尤
度原理,1.6 モデルの包含関係,1.7 尤度比検定,1.8 赤池情報量規準
2. 情報量規準
2.1 エントロピー,2.2 幾何的なイメージ,2.3 カルバック・ライブラ情報量の展開,2.4 最尤推定量
の漸近分布,2.5 予測分布,2.6 モデルの良さ,2.7 竹内情報量規準,2.8 クロスバリデーション,2.9
情報量規準GIC,2.10 ベイズ予測分布の場合,2.11 ベイズ情報量規準,2.12 確率変数の一部が観測
できない場合
3. モデル選択の信頼性
3.1 AIC のバラツキ,3.2 ブートストラップ法,3.3 AIC の差の有意性検定,3.4 近似的に不偏な検定,
3.5 マルチスケール・ブートストラップ法,3.6 多変量正規モデル,3.7 モデルの良さの検定
資料を配布する.
確率と統計第一・第二(学部),およびデータ解析(学部)を履修していることが望ましいが,
履修していなくても可能.線形代数と確率の基礎があればよい.
レポートの提出による.
詳細は講義ウェブサイトを参照
http://www.is.titech.ac.jp/~shimo/class