2021年度 | 先端人工知能

印刷

　ホーム
　> 情報理工学院
　> 情報工学コース
　> 先端人工知能

学士課程
大学院課程

2021年度　先端人工知能 Advanced Artificial Intelligence

文字サイズ小中大

開講元: 知能情報コース

担当教員名: 小野功

授業形態: 講義

メディア利用科目

曜日・時限(講義室): 火3-4 金3-4

クラス: -

科目コード: ART.T548

単位数: 2

開講年度: 2021年度

開講クォーター: 3Q

シラバス更新日: 2021年10月1日

講義資料更新日: -

使用言語: 英語

アクセスランキング

シラバス

講義の概要とねらい

本講義では先端的な人工知能技術について学びます．具体的には，試行錯誤を通じて良好な解探索するアルゴリズムである進化計算，および，試行錯誤を通じて良好な行動戦略を獲得するアルゴリズムである強化学習について講義します．
本講義では，高度に知的なシステムを構築するための数理的・論理的知識と応用技術を横断的に修得させることをねらいとします．

到達目標

本講義を履修することによって，以下の数理的知識と応用技術を習得させる．
1) 進化計算技術
2) 強化学習技術

キーワード

進化計算，ブラックボックス最適化，多目的最適化，強化学習，価値ベースの手法，方策ベースの手法，深層強化学習

学生が身につける力(ディグリー・ポリシー)

✔ 専門力

教養力

コミュニケーション力

展開力(探究力又は設定力)

展開力(実践力又は解決力)

授業の進め方

講義はスライドを使った講義と演習の併用によって進める。

授業計画・課題

	授業計画	課題
第1回	進化計算入門	講義の目的と進化計算の基礎の理解
第2回	関数最適化のための進化計算：遺伝的アルゴリズム	関数最適化，遺伝的アルゴリズムの理解
第3回	関数最適化のための進化計算：進化戦略	進化戦略の理解
第4回	組合せ最適化のための進化計算：遺伝的アルゴリズム	組合せ最適化のための遺伝的アルゴリズムの理解
第5回	離散最適化のための進化計算：分布推定アルゴリズム	ブラックボックス離散関数最適化のための分布推定アルゴリズムの理解
第6回	大域的多峰性最適化のための進化計算	大域的多峰性と大域的多峰性問題最適化のための進化計算の理解
第7回	多目的最適化のための進化計算	多目的最適化，多目的進化計算の理解
第8回	強化学習入門	強化学習の基礎の理解
第9回	深層ニューラルネットワーク	深層ニューラルネットワークの理解
第10回	Deep Q-Network (DQN)	Deep Q-Network (DQN) の理解
第11回	DQNの改良	DQNの改良版の理解
第12回	方策勾配法とActor-Critic法	REINFORCE, A2C, A3Cの理解
第13回	Trust Region Policy OptimizationとProximal Policy Optimization	Trust Region Policy Optimization (TRPO)とProximal Policy Optimization (PPO)の理解
第14回	Deep Deterministic Policy Gradient, Twin Delayed Deterministic Policy Gradient, Soft Actor-Critic	Understand Deep Deterministic Policy Gradient (DDPG), Twin Delayed Deterministic Policy Gradient (TD3), Soft Actor-Critic (SAC)の理解

授業時間外学修（予習・復習等）

学修効果を上げるため，教科書や配布資料等の該当箇所を参照し，「毎授業」授業内容に関する予習と復習（課題含む）をそれぞれ概ね100分を目安に行うこと。

教科書

教科書の指定はない。講義資料を配付する。

参考書、講義資料等

Artificial Intelligence - A Modern Approach (Third Edition, Prentice Hall) ほか

成績評価の基準及び方法

各講義で出題するレポートで評価する．

履修の条件(知識・技能・履修済科目等)

JavaとPythonのプログラミング経験があることが望ましい。

国立大学法人東京工業大学