コンピュータビジョンとは計算機を使って画像や動画の入力から有用な情報を抽出するための技術の総称である。本講義では、画像処理・画像特徴抽出・三次元形状復元・カメラ校正といったコンピュータビジョンの基礎について学ぶ。現在著しい発展を遂げている画像認識や画像生成の基礎となる技術の習得をねらう。
・基礎的な画像処理・画像フィルタ・特徴抽出・三次元復元の手法を説明でき、かつ実装できる。
・画像の領域分割とカメラ校正について説明できる。
✔ 該当する | 実務経験と講義内容との関連(又は実践的教育内容) |
---|---|
自動車関連の企業において特徴抽出・三次元復元・カメラ校正などを扱ってきた。 |
画像処理、画像フィルタリング、画像特徴、オプティカルフロー、エピポーラ幾何、ステレオマッチング、画像領域分割、カメラ校正
✔ 専門力 | 教養力 | コミュニケーション力 | 展開力(探究力又は設定力) | 展開力(実践力又は解決力) |
スライドを用いた講義とプログラミング演習を行う。
授業計画 | 課題 | |
---|---|---|
第1回 | 導入 | コンピュータビジョンの全体像を俯瞰する。 |
第2回 | 画像処理の基礎 | デジタル画像処理の基礎を学ぶ。 |
第3回 | 演習:画像処理 | デジタル画像の基礎的な処理を実装する。 |
第4回 | フィルタリング | 平滑化やエッジ抽出などの二次元フィルタについて学ぶ。 |
第5回 | 演習:フィルタリング | 基礎的な画像フィルタを実装する。 |
第6回 | 画像特徴 | 代表的なキーポイント検出器や局所特徴記述子について学ぶ。 |
第7回 | 演習:画像特徴 | 代表的なキーポイント検出器や局所特徴記述子を実装する。 |
第8回 | オプティカルフロー | ルーカス・金出法などについて学ぶ。 |
第9回 | エピポーラ幾何 | 基礎行列と運動パラメタ推定について学ぶ。 |
第10回 | ステレオマッチング | ステレオカメラからの三次元復元について学ぶ。 |
第11回 | 演習:三次元復元 | 複数画像からの三次元復元処理を実装する。 |
第12回 | 領域分割 | レベルセットやグラフカットについて学ぶ。 |
第13回 | カメラ校正 | カメラの外部パラメタと内部パラメタの同定について学ぶ。 |
第14回 | 関連論文解説 | 本講義に関連する論文を概説する。 |
講義で学んだことを1時間程度復習すること。
なし。
講義スライドを授業時に共有する。
Richard Szeliski, Computer Vision: Algorithms and Applications, 2nd ed., Springer, 2011.
Richard Hartley and Andrew Zisserman, Multiple View Geometry in Computer Vision, 2nd ed., Cambridge University Press, 2004.
ファイナルレポート(40%)、3通のショートレポート(60%)
学部卒レベルの計算機科学ならびに線形代数・微積分・確率統計の知識があること。
isato[at]c.titech.ac.jp; reikawa[at]c.titech.ac.jp
水曜日11:30-12:00
MATLABとPythonが使える環境を準備すること。