数理統計学の基礎知識(確率と統計第二など)を前提として,実例をもとにデータの統計的解析法について述べる。統計処理ソフトウェアであるRを用いて自分自身で多変量解析のプログラムを作成してデータ解析を行なう。
「R を用いたデータ解析入門」.統計処理ソフトウエアであるRを利用して実践的なデータ解析ができるようになること(R に含まれる関数を呼び出してデータ解析を実行する),背後にある数学,統計学,アルゴリズムを理解すること(自分自身で関数を記述し,それを用いてデータ解析を行う)を目標とする.
1. イントロダクション(社会人口統計データ,バイオインフォマティクス)
2. 期待値,大数の法則(ポートフォリオ,ヒストグラム)
3. モンテカルロ法(MCMC法,ギブスサンプラ)
4. ベイズの定理(画像復元)
5. 積率母関数,中心極限定理
6. 確率モデル(正規混合分布)
7. 判別問題,分類,識別(スパムメール判別)
8. パラメタ推定(最尤推定)
9. EM アルゴリズム(教師無し学習)
10. 最尤推定量の性質(クラメール・ラオの不等式,フィッシャー情報行列)
11. 検定と信頼区間
12. 線形回帰分析(ボストン住宅価格)
13. ロジスティック回帰分析(スパムメール判別のつづき,ニュートン法)
14. 主成分分析(ボストン住宅価格のつづき)
講義スライド(PDF 形式)を講義ウェブサイトから各自ダウンロードする.
講義で使ったスクリプトやデータは下記URLからダウンロードする.
http://www.is.titech.ac.jp/~shimo/class/data2011/index.html
理論的な理解を深めるためには確率と統計第一・第二を履修していることが望ましいが,履修し
ていなくても可能.R にシンタックスが類似の言語(Java 等)の経験があればよい.R プログ
ラミングの詳細は講義中で説明せず,アルゴリズムの説明をとおして多少説明する程度である.
レポートおよびミニテスト