現代社会では,ほとんどすべての分野において計算とデータの活用が欠かせない時代になってきている.本講義では,理工系の研究者・技術者として活躍していくために重要となる,大量のデータをコンピュータを利用して解析し,利用するための基礎を講義し,基礎技術を演習で教える.
本講義のねらいは,(1) データを処理し,分析するために必要な,統計やコンピュータ上の計算処理に関する基礎知識を教えること,(2) コンピュータ・ソフトウェアを用いてデータを処理・分析し,そこから重要な知見得る基礎技術を身に付けさせることである.
(1) 統計の基礎知識を用いデータ分析を適切に行いその意味を客観的に評価できるようになる
(2) コンピュータによるデータの処理の基本を理解し,データマイニングのためのコンピュータ・ソフトウェアを適切に利用できるようになる
データマイニンング,計算(情報処理),知識表現,データマイニング・ソフトウェア,検定
✔ 専門力 | 教養力 | コミュニケーション力 | 展開力(探究力又は設定力) | ✔ 展開力(実践力又は解決力) |
講義と演習を交互に行いながら授業を進める.大岡山とすすかけ台の両方で対面により授業が受けられるようにする.なお,大岡山では日本語で,すずかけ台では英語で授業を行う.初回(6月11日(月))に大岡山キャンパスにて講義のやり方と演習のためのパソコン設定のガイダンスを行う.
授業計画 | 課題 | |
---|---|---|
第1回 | クラスガイダンスと各自のPC上へのソフトウェアのインストールのガイダンス | 各自のPCの上で演習用のソフトウエアが準備される. |
第2回 | 計算とプログラミングに関する簡単な入門 データマインマイニングの導入:統計などの基礎知識 | 計算(情報処理)とデータマイニングの基本的な考え方について理解でき,本科目の講義・演習の準備ができる. |
第3回 | 演習:キノコデータの解析 | データマイニングの概要を理解し,基本的なデータ(事例集合)が何かを説明できるようになる |
第4回 | Classification(導入):単純規則と naiive bayesian rule | Classification の概要を理解し,単純規則ならびにnaiive bayesian rule の導出について説明できるようになる |
第5回 | 演習:naiive bayesian rule | 単純な判定規則の生成の仕組みを特徴を理解し,生成ソフトを適切に使えるようになる |
第6回 | Classification: decision tree | Decision tree の構成原理を説明できるようになる |
第7回 | 演習:decsion rule | Decision tree 生成アルゴリズムの仕組みを理解し,標準的な decision tree 生成ソフトを適切に使えるようになる |
第8回 | Association rule | Association rule の考え方と評価方法を説明できるようになる |
第9回 | 演習:association rule | Association rule 生成アルゴリズムの仕組みを理解し,標準的な生成ソフトを適切に使えるようになる |
第10回 | Regression | Regression の考え方と各種評価方法を説明できるようになる |
第11回 | 演習:regression | Regression rules の導出原理を理解し,代表的な生成ソフトを適切に使えるようになる |
第12回 | Clustering | Clustering の考え方と clustering の基本手法の原理を説明できるようになる |
第13回 | 演習:clustering | Clustering の代表的な手法の仕組みを理解し,大代表的な clustering の形成ソフトを適切に使えるようになる |
第14回 | まとめと発展的な話題 | 本講義で学んだ様々な手法を適切に使えるようになり,さらに進んだ話題についても概観できるようになる. |
第15回 | 期末課題 | 基本的ではあるが実際的なデータマイニングの課題に対して,適切な手法を適用できるようになり,得られた成果を評価できるようになる. |
I.H. Witten, E. Frank, M.A. Hall, and C. Pal, Data Mining: Practical Machine Learning Tools and Techniques (The 4th Ed.),
Morgan Kaufmann Pub., 2013, ISBN-13: 978-0128042915
Weka Web Page, https://www.cs.waikato.ac.nz/ml/weka/
演習課題レポート(90%),期末課題レポート(10%)
演習では各自のパソコンにデータマイニング用システム Weka をインストールして用いる.インストール方法などは初回の授業ガイダンス(6月11日(月)大岡山キャンパスのみ)の後に指導する.この指導を受けたい場合には,東工大キャンパス無線LANにつなげられるよう準備したPCを初回の授業のときに持ってくること.
watanabe[at]c.titech.ac.jp(渡辺治)
質問はメールベースで随時受けつける
初回の授業(6月11日(月)9時より,大岡山キャンパスにて)に参加できない場合には,前もって担当教員(渡辺,watanabe@c.titech.ac.jp)までメールをしておくこと.