すべての分野において計算とデータの活用が欠かせない時代になってきている.本講義では,理工系の研究者・技術者として活躍していくために重要となる,大量のデータをコンピュータを利用して解析し,利用するための基礎的な方法を教授する.本講義のねらいは,データを処理し分析するために必要な,統計学的方法に関する基礎知識を身につけさせることである.
統計学の基礎知識を用いてデータ分析を適切に行い,その意味を客観的に評価できるようになること
分類,クラスタリング,次元圧縮,訓練誤差と汎化誤差,交差検証
✔ 専門力 | 教養力 | コミュニケーション力 | 展開力(探究力又は設定力) | ✔ 展開力(実践力又は解決力) |
Zoomによる講義を行う.
授業計画 | 課題 | |
---|---|---|
第1回 | ガイダンス | 授業計画の説明.使用する計算機環境,プログラミング言語(Python)について学ぶ. |
第2回 | データ分析の基礎 | 統計学,データサイエンスの基礎について学ぶ |
第3回 | 分類とモデル評価 | ラベルのついたデータから判別規則を抽出する手法について学ぶ.訓練誤差と汎化誤差の違い,モデル評価の方法について学ぶ. |
第4回 | クラスタリング | ラベルのないデータをいくつかのクラスに分ける方法について学ぶ |
第5回 | 主成分分析 | 主成分分析とその背後にある数理について学ぶ |
第6回 | 次元圧縮 | 正準相関分析,グラフ埋め込みなど多変量解析における次元圧縮の手法を学ぶ. |
第7回 | 発展的トピック | アンサンブル学習の手法について学ぶ. |
学修効果を上げるため,教科書や配布資料等の該当箇所を参照し,「毎授業」授業内容に関する予習と復習(課題含む)をそれぞれ概ね100分を目安に行うこと。
特になし.
T2SCHOLAにて電子的に配布する
授業内での小テスト/レポートにもとづいて評価する
線形代数学,微分積分学,数理統計学に関する基本的な知識を必要とする.
博士後期課程の方は、XCO.T677「基盤データサイエンス発展」を申告してください。基盤データサイエンスと基盤データサイエンス発展の両方を同時に申告することはできません。