コンピュータビジョンとは計算機を使って画像や動画の入力から有用な情報を抽出するための技術の総称である.本講義では、基礎的な画像処理をはじめとして,画像によって物体の形状・運動・意味を理解するための方法について学ぶ.現在著しい発展を遂げているAIによる画像認識や画像生成の基礎となる技術の習得をねらう.
・フィルタリング・三次元復元・物体追跡の手法を説明でき,かつ実装できる.
・画像検索・画像認識・画像分割の手法を説明できる.
✔ 該当する | 実務経験と講義内容との関連(又は実践的教育内容) |
---|---|
自動車関連の企業において三次元復元・物体追跡・画像検索・画像認識・画像分割等のコンピュータビジョン技術の研究開発を行ってきた. |
オプティカルフロー,エピポーラ幾何,ステレオマッチング,SLAM,ロバスト推定,カメラ校正,カルマンフィルタ,粒子フィルタ,部分空間法,グラフカット,マルコフ確率場
✔ 専門力 | 教養力 | コミュニケーション力 | 展開力(探究力又は設定力) | 展開力(実践力又は解決力) |
スライドとサンプルプログラムを用いた講義を行う.
授業計画 | 課題 | |
---|---|---|
第1回 | 画像処理 | 撮像,幾何変換,再標本化,符号化 |
第2回 | フィルタリング | 空間フィルタリング,周波数フィルタリング,テンプレートマッチング |
第3回 | フィルタリング演習 | MATLABによるフィルタリングの実装 |
第4回 | 三次元復元 (1/3) | オプティカルフロー,射影変換,特異値分解,エピポーラ幾何 |
第5回 | 三次元復元 (2/3) | 因子分解法,ステレオ平行化,ロバスト推定 |
第6回 | 三次元復元 (3/3) | バンドル調整,カメラ校正 |
第7回 | 三次元復元演習 | MATLABによる三次元復元アルゴリズムの実装 |
第8回 | 物体追跡 | カルマンフィルタ,粒子フィルタ |
第9回 | 物体追跡演習 | MATLABによる物体追跡アルゴリズムの実装 |
第10回 | 画像検索 | 局所特徴量,近似最近傍探索 |
第11回 | 画像認識 | 部分空間法,サポートベクトルマシン,特徴集約 |
第12回 | 画像分割 | 平均値シフト,マルコフ確率場,グラフカット |
第13回 | 物理ベースドビジョン | 物体の光学特性,フォトメトリックステレオ,陰影からの形状復元 |
第14回 | イベントベースドビジョン | オドメトリ推定,SLAM |
講義で学んだことを1時間程度復習すること.
なし.
講義スライドを授業時に共有する.
Richard Szeliski, Computer Vision: Algorithms and Applications, 2nd ed., Springer, 2011.
Richard Hartley and Andrew Zisserman, Multiple View Geometry in Computer Vision, 2nd ed., Cambridge University Press, 2004.
2通のレポート (50%, 50%)
学部卒レベルの計算機科学ならびに線形代数・微積分・確率統計の知識があること.
isato[at]c.titech.ac.jp
火曜日17:20-17:40
MATLABの環境を準備することを推奨する.