2023年度 ロボット聴覚と環境理解   Robot Audition and Scene Analysis

文字サイズ 

アップデートお知らせメールへ登録 お気に入り講義リストに追加
開講元
システム制御コース
担当教員名
中臺 一博 
授業形態
講義    (対面型)
メディア利用科目
曜日・時限(講義室)
火3-4(W9-325(W934))  
クラス
-
科目コード
SCE.I434
単位数
1
開講年度
2023年度
開講クォーター
1Q
シラバス更新日
2023年9月13日
講義資料更新日
-
使用言語
英語
アクセスランキング
media

講義の概要とねらい

本講義では、音を聞き分けることができるロボットの耳の機能を実現するための「ロボット聴覚」、および音を含め環境を分析・把握するための「環境理解」といった研究領域について、これらを実現するための技術、その変遷、現状や展望について多面的に学習します。具体的には、聴覚処理、音響信号処理、機械学習をベースに音の到来方向を推定する音源定位、さまざまな音が混ざった混合音から特定の音源を抽出する音源分離をはじめ、音の種類の識別や音声を認識する技術を扱います。

到達目標

本講義を履修することにより、以下の知識と能力を習得する
 ロボット聴覚、音環境理解といった音を扱う研究領域について多面的に理解し、正しく説明できる。
 音源定位、音源分離、音源識別、音声認識といった具体的な音を扱う技術を正しく理解し、説明できる。

実務経験のある教員等による授業科目等

該当する 実務経験と講義内容との関連(又は実践的教育内容)
この講義は、2000年の立ち上げ以来、この研究分野をリードしてきた教員が行います。

キーワード

ロボット聴覚、環境理解、音響信号処理、機械学習、深層学習、音源定位、音源追跡、音源分離、音源識別、音声認識

学生が身につける力(ディグリー・ポリシー)

専門力 教養力 コミュニケーション力 展開力(探究力又は設定力) 展開力(実践力又は解決力)

授業の進め方

一連の流れに沿って、各回のトピックを解説する。グループディスカッションや講義内容に関するレポート課題を課す場合もある。

授業計画・課題

  授業計画 課題
第1回 ロボット聴覚と環境理解の概要と変遷 2000年に始まったロボット聴覚研究、および、ロボット聴覚と関連の深い環境理解とともにその研究領域の概要、関連性および変遷を理解する。
第2回 聴覚情景分析と音環境理解 本講義の基礎となる音響信号処理を簡単に復習するとともに、ロボット聴覚の前身の研究領域である音環境理解および聴覚情景分析について理解する。
第3回 両耳聴ロボット聴覚 人や動物のように二本のマイクロホンで音を聞き分ける技術を理解する。
第4回 マイクロホンアレイによるロボット聴覚 複数のマイクロホンからなるマイクロンアレイを用いた音源定位や分離の手法を理解する。
第5回 極限環境ロボット聴覚 ロボット聴覚技術の極限環境への適用を通じて、その課題や解決のアプローチを理解する。
第6回 深層学習によるロボット聴覚技術 ニューラルネットワークによる深層学習を用いた音源定位、分離、認識、識別といった手法について、概要、仕組み、技術動向を理解する。
第7回 ソフトウェアプラットホームと今後のロボット聴覚 ロボット聴覚のオープンソースソフトウェアであるHARKについて実環境問題に適用するという観点から、その設計思想、利点、課題を理解する。また、これからのロボット聴覚や環境理解の展望について議論する。

授業時間外学修(予習・復習等)

学修効果を上げるため,教科書や配布資料等の該当箇所を参照し,「毎授業」授業内容に関する 予習と復習(課題含む)をそれぞれ概ね100分を目安に行うこと。

教科書

特に指定しない

参考書、講義資料等

特に指定しない

成績評価の基準及び方法

講義内容に関する理解度、および考察力を評価する。毎回の小テスト相当の課題およびレポートにて成績評価を実施する。

関連する科目

  • SCE.I433 : 知的コミュニケーションと社会的インタラクション
  • SCE.I501 : 視覚認識
  • SCE.I406 : 機械学習フレームワーク

履修の条件(知識・技能・履修済科目等)

デジタル信号処理や機械学習に関する学部レベルの基礎的な知識を有すること。

連絡先(メール、電話番号)    ※”[at]”を”@”(半角)に変換してください。

nakadai[at]ra.sc.e.titech.ac.jp

このページのトップへ