すべての分野において計算とデータの活用が欠かせない時代になってきている.本講義では,理工系の研究者・技術者として活躍していくために重要となる,大量のデータをコンピュータを利用して解析し,利用するための基礎的な方法に関する演習を行う.本講義のねらいは,コンピュータを用いてデータを処理・分析し,そこから重要な知見を得るための基礎技術を身に付けさせることである.
統計的機械学習およびコンピュータを用いたデータの処理の基本を理解し,統計学的分析のためのソフトウェア/プログラムを適切に利用できるようになること.
機械学習,分類,回帰,クラスタリング,次元圧縮,訓練誤差と汎化誤差,モデル選択
✔ 専門力 | 教養力 | コミュニケーション力 | 展開力(探究力又は設定力) | 展開力(実践力又は解決力) |
学生は原則対面にて実施する。講義と演習を交互に行いながら授業を進める.講義内容に続き,関連したプログラミング演習を行う.
授業計画 | 課題 | |
---|---|---|
第1回 | 12/15(金)ガイダンス | 履修に必要となる数学的事項およびデータサイエンスの概要について学ぶ. |
第2回 | 12/15 Fri. 演習:Pythonの基礎 | Python言語を用いた計算(情報処理)の基本的な考え方について理解でき,本科目の講義・演習の準備ができる. |
第3回 | 12/22(金)データ分析の基礎 | 統計学,データサイエンスの基礎について学ぶ |
第4回 | 12/22(金)演習:計算環境の整備と活用 | データ分析の基盤であるGoogle Colaboratoryや、Pythonおよびそのライブラリについて学ぶ. |
第5回 | 1/5(金)分類とモデル選択 | ラベルのついたデータから判別規則を抽出する手法について学ぶ.訓練誤差と汎化誤差の違い,モデル評価の方法について学ぶ. |
第6回 | 1/5(金)演習:分類とモデル選択 | Decision tree の構成原理を理解し,利用できるようになる. |
第7回 | 1/19(金)クラスタリング | 教師なし学習の概念およびクラスタリングアルゴリズムの仕組みを理解する。 |
第8回 | 1/19(金)演習:クラスタリング | クラスタリングアルゴリズムの仕組みを理解し,仮想的なデータに対して適用できるようになる. |
第9回 | 1/26(金)主成分分析 | 主成分分析とその背後にある数理について学ぶ. |
第10回 | 1/26(金)演習:主成分分析 | 主成分分析を仮想的なデータに対して適用できるようになる. |
第11回 | 1/30(火)次元圧縮 | 多次元尺度構成法,正準相関分析など多変量解析における次元圧縮の手法を学ぶ. |
第12回 | 1/30(火)演習:次元圧縮 | 次元圧縮を仮想的なデータに対して適用できるようになる. |
第13回 | 2/2(金)アンサンブル学習 | アンサンブル学習の概念を理解し,代表的な手法を説明できるようになる. |
第14回 | 2/2(金)演習:アンサンブル学習 | アンサンブル学習を仮想的なデータに対して適用できるようになる. |
学修効果を上げるため,講義および演習資料の該当箇所を参照し,「毎授業」授業内容に関する予習と復習(課題含む)をそれぞれ概ね100分を目安に行うこと。
特になし.
T2SCHOLA またはZoom上にて電子的に配布する。
講義・演習に関するレポートおよび最終課題にもとづいて評価する。
線形代数学,微分積分学,数理統計学に関する基本的な知識があることが望ましい.
質問はメール等で随時受けつける.
本授業科目は、TAC-MI登録学生対象科目です。今年度はTAC-MI登録学生限定とします。XCO.T487 : 基盤データサイエンスとXCO.T488 : 基盤データサイエンス演習を合わせたものと同一内容になっており、重複履修できません。XCO.T489 : 基盤人工知能と
XCO.T490 : 基盤人工知能演習は本講義と関連が深い内容を取り扱っているため、履修を推奨します。
Google Colaboratory を使って演習を行います.第1回目までに各自 Google アカウントを取得し,Google Drive でのファイルアップロード/ダウンロードができるようにしておくことが望ましいです。