すべての分野において計算とデータの活用が欠かせない時代になってきている.本講義では,理工系の研究者・技術者として活躍していくために重要となる,大量のデータをコンピュータを利用して解析し,利用するための基礎的な方法に関する演習を行う.本講義のねらいは,コンピュータ・ソフトウェアを用いてデータを処理・分析し,そこから重要な知見得る基礎技術を身に付けさせることである.
コンピュータによるデータの処理の基本を理解し,統計学的分析のためのコンピュータ・ソフトウェアを適切に利用できるようになること
分類,回帰,クラスタリング,次元圧縮,訓練誤差と汎化誤差,交差検証
✔ 専門力 | 教養力 | コミュニケーション力 | 展開力(探究力又は設定力) | ✔ 展開力(実践力又は解決力) |
講義科目「基盤データサイエンス」と連動し,講義内容に関連したプログラミング演習を行う.演習はZoomで行う.
授業計画 | 課題 | |
---|---|---|
第1回 | ガイダンス,Pythonの基礎 | 変数,制御文,関数等 |
第2回 | 記述統計と推測統計 | Pythonのライブラリであるpandasを利用し,記述統計や推測統計などデータ分析の基礎を実施する |
第3回 | 分類 | ラベルのついたデータから判別規則を抽出する手法について演習を行う |
第4回 | クラスタリング | ラベルのないデータをいくつかのクラスに分ける方法について演習を行う |
第5回 | 主成分分析 | 主成分分析について演習を行う |
第6回 | 次元圧縮 | 正準相関分析,グラフ埋め込みなど多変量解析における次元圧縮の手法について演習を行う |
第7回 | 発展的トピック | アンサンブル学習の手法について演習を行う |
学修効果を上げるため,教科書や配布資料等の該当箇所を参照し,「毎授業」授業内容に関する予習と復習(課題含む)をそれぞれ概ね100分を目安に行うこと。
特になし
T2SCHOLAにて電子的に配布する
演習課題に関するレポートに基づく
本演習を履修する場合は,同年度・同クォータに開講される「XCO.T487 基盤データサイエンス」,「XCO.T489 基盤人工知能」および,「XCO.T490 基盤人工知能演習」を同時に履修することを強く推奨します.なお,物質・情報卓越教育院の登録学生は,「XCO.T487 基盤データサイエンス」および「XCO.T488 基盤データサイエンス演習」の代わりに「TCM.A404 マテリアルズインフォマティクス」を受講してください.
博士後期課程の方はXCO.T678「基盤データサイエンス発展演習」を申告してください。基盤データサイエンス演習と基盤データサイエンス発展演習の同時の申告はできません。
Google Colaboratory を使って演習を行います.第1回目までに各自 Google アカウントを取得し,Google Drive でのファイルアップロード/ダウンロードができるようにしておいてください.