本講義は,3人の講師のオムニバス形式で「オンライン最適化」の基礎知識から研究の最前線まで広く解説する.古典的な最適化問題では入力が一度にすべて与えられるのに対して,オンライン最適化では一部の情報が逐次的に与えられる.オンライン最適化はモデルにより扱える状況や解析が様々である.講義の前半ではオンライン最適化の競合比解析,後半ではリグレット解析に焦点を当て,代表的な問題・アルゴリズム・解析手法について解説する.
近年オンライン最適化は最適化の理論のみならず機械学習や人工知能の分野でも盛んに研究が進んでおり,今ではオンライン最適化の理論とアルゴリズムは社会において必要不可欠である.本講義のねらいは社会を支えるオンライン最適化の考え方と基礎理論を学んでもらうことである.
本講義の講義予定は以下の通りである.詳細は初回に周知する.
・第1回 6月11日(金)5-6限
・第2―13回 6月15日(火)より毎週火曜,5-6, 7-8限
・第14回 7月27日(火)5-6限
本講義の到達目標は以下である.
1) オンライン最適化の代表的な問題とモデルの分類を説明できる
2) 競合比解析の基本的な考え方と代表例を説明できる
3) リグレット解析の基本的な考え方と代表例を説明できる
✔ 該当する | 実務経験と講義内容との関連(又は実践的教育内容) |
---|---|
本講義の講師はこれまでに実務としてオンライン最適化に関する研究を行っている. |
オンライン最適化,競合比,リグレット,ゲーム,機械学習
✔ 専門力 | 教養力 | コミュニケーション力 | 展開力(探究力又は設定力) | ✔ 展開力(実践力又は解決力) |
毎回ひとつのトピックを講義形式で解説する.
授業計画 | 課題 | |
---|---|---|
第1回 | イントロダクション | オンライン最適化の概要を把握する |
第2回 | 決定性アルゴリズムの競合比解析(1/2) | |
第3回 | 決定性アルゴリズムの競合比解析(2/2) | |
第4回 | 乱択アルゴリズムの競合比解析(1/2) | |
第5回 | 乱択アルゴリズムの競合比解析(2/2) | |
第6回 | 秘書問題 | |
第7回 | 預言者の不等式 | 中間レポート |
第8回 | エキスパート問題(1/2): 貪欲アルゴリズムとリグレットの定義 | |
第9回 | エキスパート問題(2/2): 乗算型重み更新アルゴリズムとリグレット解析 | |
第10回 | オンライン凸最適化 | |
第11回 | 多腕バンディット問題(1/2): 敵対的モデル | |
第12回 | 多腕バンディット問題(2/2): 確率的モデル | |
第13回 | 線形バンディット | 期末レポート |
第14回 | 復習と演習 |
特に設定しない.
講義資料はアップロードする.参考書は講義中に周知する.
中間レポートと期末レポートにより評価する.
基本的な数学・学部レベルの最適化に関する知識があることが望ましい.