2023年度 コンピュータビジョン   Computer Vision

文字サイズ 

アップデートお知らせメールへ登録 お気に入り講義リストに追加
開講元
知能情報コース
担当教員名
佐藤 育郎  関川 雄介 
授業形態
講義    (ハイフレックス型)
メディア利用科目
曜日・時限(講義室)
火7-8(W8E-307(W833))  金7-8(W8E-307(W833))  
クラス
-
科目コード
ART.T467
単位数
2
開講年度
2023年度
開講クォーター
1Q
シラバス更新日
2023年3月20日
講義資料更新日
-
使用言語
英語
アクセスランキング
media

講義の概要とねらい

コンピュータビジョンとは計算機を使って画像や動画の入力から有用な情報を抽出するための技術の総称である.本講義では、基礎的な画像処理をはじめとして,画像によって物体の形状・運動・意味を理解するための方法について学ぶ.現在著しい発展を遂げているAIによる画像認識や画像生成の基礎となる技術の習得をねらう.

到達目標

・フィルタリング・三次元復元・物体追跡の手法を説明でき,かつ実装できる.
・画像検索・画像認識・画像分割の手法を説明できる.

実務経験のある教員等による授業科目等

該当する 実務経験と講義内容との関連(又は実践的教育内容)
自動車関連の企業において三次元復元・物体追跡・画像検索・画像認識・画像分割等のコンピュータビジョン技術の研究開発を行ってきた.

キーワード

オプティカルフロー,エピポーラ幾何,ステレオマッチング,SLAM,ロバスト推定,カメラ校正,カルマンフィルタ,粒子フィルタ,部分空間法,グラフカット,マルコフ確率場

学生が身につける力(ディグリー・ポリシー)

専門力 教養力 コミュニケーション力 展開力(探究力又は設定力) 展開力(実践力又は解決力)

授業の進め方

スライドとサンプルプログラムを用いた講義を行う.

授業計画・課題

  授業計画 課題
第1回 画像処理 撮像,幾何変換,再標本化,符号化
第2回 フィルタリング 空間フィルタリング,周波数フィルタリング,テンプレートマッチング
第3回 フィルタリング演習 MATLABによるフィルタリングの実装
第4回 三次元復元 (1/3) オプティカルフロー,射影変換,特異値分解,エピポーラ幾何
第5回 三次元復元 (2/3) 因子分解法,ステレオ平行化,ロバスト推定
第6回 三次元復元 (3/3) バンドル調整,カメラ校正
第7回 三次元復元演習 MATLABによる三次元復元アルゴリズムの実装
第8回 物体追跡 カルマンフィルタ,粒子フィルタ
第9回 物体追跡演習 MATLABによる物体追跡アルゴリズムの実装
第10回 画像検索 局所特徴量,近似最近傍探索
第11回 画像認識 部分空間法,サポートベクトルマシン,特徴集約
第12回 画像分割 平均値シフト,マルコフ確率場,グラフカット
第13回 物理ベースドビジョン 物体の光学特性,フォトメトリックステレオ,陰影からの形状復元
第14回 イベントベースドビジョン オドメトリ推定,SLAM

授業時間外学修(予習・復習等)

講義で学んだことを1時間程度復習すること.

教科書

なし.

参考書、講義資料等

講義スライドを授業時に共有する.
Richard Szeliski, Computer Vision: Algorithms and Applications, 2nd ed., Springer, 2011.
Richard Hartley and Andrew Zisserman, Multiple View Geometry in Computer Vision, 2nd ed., Cambridge University Press, 2004.

成績評価の基準及び方法

2通のレポート (50%, 50%)

関連する科目

  • ART.T551 : 画像・映像認識
  • XCO.T489 : 基盤人工知能
  • ART.T547 : マルチメディア情報処理論
  • ART.T463 : コンピューターグラフィクス
  • ART.T465 : スパース信号処理と最適化

履修の条件(知識・技能・履修済科目等)

学部卒レベルの計算機科学ならびに線形代数・微積分・確率統計の知識があること.

連絡先(メール、電話番号)    ※”[at]”を”@”(半角)に変換してください。

isato[at]c.titech.ac.jp

オフィスアワー

火曜日17:20-17:40

その他

MATLABの環境を準備することを推奨する.

このページのトップへ