コンピュータビジョンとは計算機を使って画像や動画の入力から有用な情報を抽出するための技術の総称である。本講義では、画像理解と画像生成に関する特定の研究領域について学ぶ。コンピュータビジョンの最前線を学ぶ力を身に着けることをねらう。
・基礎的な物体認識と物体追跡の手法を説明でき、かつ実装できる。
・本講義で紹介されたコンピュータビジョンの各分野について説明できる。
✔ 該当する | 実務経験と講義内容との関連(又は実践的教育内容) |
---|---|
自動車関連の企業において画像認識などを扱ってきた。 |
画像検索、一般物体認識、物体追跡、畳み込みニューラルネットワーク、SLAM、イメージベースドレンダリング、コンピュテーショナルフォトグラフィ、自動運転、イベントカメラ
✔ 専門力 | 教養力 | コミュニケーション力 | 展開力(探究力又は設定力) | 展開力(実践力又は解決力) |
スライドを用いた講義とプログラミング演習を行う。
授業計画 | 課題 | |
---|---|---|
第1回 | 画像検索 | Bag-of-Wordsと近似最近房探索について学ぶ。 |
第2回 | 一般物体認識 | 局所特徴記述子を利用した一般物体認識について学ぶ。 |
第3回 | 演習:物体認識 | 物体認識の基礎的な手法を実装する。 |
第4回 | 物体追跡 | 時系列フィルタを用いた物体追跡について学ぶ。 |
第5回 | 演習:物体追跡 | 物体追跡の処理を実装する。 |
第6回 | 畳み込みニューラルネットワーク | 重み共有、プーリング、全結合、誤差逆伝搬法について学ぶ。 |
第7回 | 演習:ニューラルネットワーク | ニューラルネットワークを実装する。 |
第8回 | Visual SLAM (Simultaneous Localization And Mapping) | 自己位置と三次元形状の同時最適化について学ぶ。 |
第9回 | イメージベースドレンダリング | 反射モデル、BRDF、光線空間について学ぶ。 |
第10回 | コンピュテーショナルフォトグラフィ | 超解像、ボケ除去について学ぶ。 |
第11回 | 画像のための機械学習 | 教師あり学習・教師なし学習・強化学習などについて学ぶ。 |
第12回 | 自動運転のための認識 | 自動運転に必要な認識タスクについて学ぶ。 |
第13回 | イベントカメラ | イベントカメラの基礎と応用について学ぶ。 |
第14回 | コンピュータビジョンの最前線 | 最先端の論文を概説する。 |
講義で学んだことを1時間程度復習すること。
なし。
講義スライドを授業時に共有する。
Richard Szeliski, Computer Vision: Algorithms and Applications, 2nd ed., Springer, 2011.
Richard Hartley and Andrew Zisserman, Multiple View Geometry in Computer Vision, 2nd ed., Cambridge University Press, 2004.
ファイナルレポート(40%)、3通のショートレポート(60%)
コンピュータビジョンの基礎、ならびに線形代数・微積分・確率統計の知識があること。
isato[at]c.titech.ac.jp; reikawa[at]c.titech.ac.jp
水曜日11:30-12:00
MATLABとPythonが使える環境を準備すること。