データ解析   Data Analysis

文字サイズ 

担当教員
下平 英寿 
使用教室
火3-4(W834)  
単位数
講義:2  演習:0  実験:0
講義コード
5522
シラバス更新日
2011年4月6日
講義資料更新日
2012年3月21日
アクセス指標
学期
前期  /  推奨学期:5

講義概要

数理統計学の基礎知識(確率と統計第二など)を前提として,実例をもとにデータの統計的解析法について述べる。統計処理ソフトウェアであるRを用いて自分自身で多変量解析のプログラムを作成してデータ解析を行なう。

講義の目的

「R を用いたデータ解析入門」.統計処理ソフトウエアであるRを利用して実践的なデータ解析ができるようになること(R に含まれる関数を呼び出してデータ解析を実行する),背後にある数学,統計学,アルゴリズムを理解すること(自分自身で関数を記述し,それを用いてデータ解析を行う)を目標とする.

講義計画

1. イントロダクション(社会人口統計データ,バイオインフォマティクス)
2. 期待値,大数の法則(ポートフォリオ,ヒストグラム)
3. モンテカルロ法(MCMC法,ギブスサンプラ)
4. ベイズの定理(画像復元)
5. 積率母関数,中心極限定理
6. 確率モデル(正規混合分布)
7. 判別問題,分類,識別(スパムメール判別)
8. パラメタ推定(最尤推定)
9. EM アルゴリズム(教師無し学習)
10. 最尤推定量の性質(クラメール・ラオの不等式,フィッシャー情報行列)
11. 検定と信頼区間
12. 線形回帰分析(ボストン住宅価格)
13. ロジスティック回帰分析(スパムメール判別のつづき,ニュートン法)
14. 主成分分析(ボストン住宅価格のつづき)

教科書・参考書等

講義スライド(PDF 形式)を講義ウェブサイトから各自ダウンロードする.
講義で使ったスクリプトやデータは下記URLからダウンロードする.
http://www.is.titech.ac.jp/~shimo/class/data2011/index.html

関連科目・履修の条件等

理論的な理解を深めるためには確率と統計第一・第二を履修していることが望ましいが,履修し
ていなくても可能.R にシンタックスが類似の言語(Java 等)の経験があればよい.R プログ
ラミングの詳細は講義中で説明せず,アルゴリズムの説明をとおして多少説明する程度である.

成績評価

レポートおよびミニテスト

このページのトップへ