2016年度 音声情報処理   Speech Information Processing

文字サイズ 

アップデートお知らせメールへ登録 お気に入り講義リストに追加
開講元
知能情報コース
担当教員名
篠田 浩一 
授業形態
講義
メディア利用
 
曜日・時限(講義室)
月7-8(W831,G111)  木7-8(W831,G111)  
クラス
-
科目コード
ART.T460
単位数
2
開講年度
2016年度
開講クォーター
3Q
シラバス更新日
2016年4月27日
講義資料更新日
-
使用言語
英語
アクセスランキング
media

講義の概要とねらい

本講義では,まず人間の音声と言語について,工学的応用に必要な知識を習得した上で,音声情報処理,特に,音声認識技術を概観します。その次に,音声認識システムを構成する要素技術,認識モデル,言語モデル,探索アルゴリズムについて習得します。さらにその実応用のために必要な,最適化・適応化,識別学習などの技術を習得します。最後に音声認識以外の応用として,音声合成,話者認識について学習します。

到達目標

本講義を履修することによって次の能力を習得する。
1) 人間の音声の生成・知覚の仕組みについて説明できる。
2) 音声認識システムを構成する各要素技術について説明できる。
3) 音声認識における確率モデルの重要性を理解し、それを用いた学習・認識のアルゴリズムを説明できる。
4) 音声認識システムを自ら構築できる。

キーワード

音声情報処理、音声認識、音声分析、音声符号化、音声合成、音響モデル、言語モデル、探索アルゴリズム、グラフィカルモデル、隠れマルコフモデル

学生が身につける力(ディグリー・ポリシー)

専門力 教養力 コミュニケーション力 展開力(探究力又は設定力) 展開力(実践力又は解決力)

授業の進め方

1) 毎回の講義の最初に、前回の復習をします。
2) 講義の最後に選択課題を出します。
3) 毎回の授業で出席をとります。
4) 授業の前に、授業計画に記載されている内容について、予習しておくことが望まれます。

授業計画・課題

  授業計画 課題
第1回 音声と言語 講義で指定する。
第2回 音声分析・音声符号化 講義で指定する。
第3回 音声認識とは 講義で指定する。
第4回 グラフィカルモデル 講義で指定する。
第5回 隠れマルコフモデル 講義で指定する。
第6回 認識・学習アルゴリズム 講義で指定する。
第7回 言語モデル 講義で指定する。
第8回 探索アルゴリズム 講義で指定する。
第9回 最適化・適応化 講義で指定する。
第10回 耐雑音処理 講義で指定する。
第11回 音声認識のための識別学習 講義で指定する。
第12回 音声認識の応用 講義で指定する。
第13回 音声合成・声質変換 講義で指定する。
第14回 話者認識 講義で指定する。
第15回 今後の展望 講義で指定する。

教科書

特になし

参考書、講義資料等

S.Furui 著 『Digital Speech Processing,Synthesis,and Recognition』 Mercel Dekker,古井貞煕著 『音声情報処理』 森北出版

成績評価の基準及び方法

毎回の課題(20%)、2つのレポート課題(80%)により評価する。

関連する科目

  • ART.T547 : マルチメディア情報処理論

履修の条件(知識・技能・履修済科目等)

学部レベルの計算機科学の知識があること。

その他

特になし

このページのトップへ