言語を記号の計算システムとして捉える考え方に基づき,コンピュータによって言語を扱うための基礎的な概念や技術について学ぶ.まず,言語処理研究の歴史や応用,言語学に代表される言語を扱う関連分野との関係を概観し.自然言語処理の位置付けについて学ぶ.与えられたテキストからそのテキストの意味内容を抽出する過程は,形態素解析,統語解析,意味解析,談話解析に分けて考えることができる.各解析過程は言語学でいう形態論,統語論,意味論,語用論に対応している.言語学の知見もふまえながら,各解析過程について基本的な概念と代表的手法を学ぶ.さらに言語処理研究の基礎データとなる種々の言語資源の構築や利用について学ぶ.最後にテキストを生成する言語生成の基礎的な概念と技術について学ぶ.
【到達目標】 自然言語処理の基礎的な概念,代表的な手法について理解し,それらを応用システムで活用するための基礎技術を習得することを目標とします.
【テーマ】 本講義では人工知能の一分野である自然言語処理について学びます.自然言語処理は人間が日常で使う日本語や英語などの言語をコンピュータで処理し,言語表現が表わす意味・意図を抽出したり,また,逆に言語表現を作り出す技術です.言語を研究対象とする学問の代表は言語学ですが,講義では言語学の知見がどのように自然言語処理に活かされるかについても学びます.
計算言語学,コーパス言語学,形態素解析,統語解析,意味解析,談話解析,言語資源,言語生成
✔ 専門力 | 教養力 | コミュニケーション力 | 展開力(探究力又は設定力) | 展開力(実践力又は解決力) |
毎回の講義では,まず前回の課題について議論した後,その回の内容について講義をおこないます.その講義に関する課題を次回までに解いてきてもらいます.
授業計画 | 課題 | |
---|---|---|
第1回 | 導入:自然言語処理の歴史,応用,言語学との関係 | 講義で指定する. |
第2回 | 形態素解析 (1):形態論,計算形態論,接辞処理 | |
第3回 | 形態素解析 (2):形態素解析の目的,品詞タグセット,品詞付与 | |
第4回 | 形態素解析 (3):規則に基づく形態素解析,統計的形態素解析 | |
第5回 | 統語解析 (1):統語論,生成文法,単一化文法 | |
第6回 | 統語解析 (2):統語解析アルゴリズム,下降型深さ優先解析,上昇型深さ優先解析 | |
第7回 | 統語解析 (3):到達可能性,チャート法 | |
第8回 | 意味解析 (1):意味論,一階述語論理,知識表現 | |
第9回 | 意味解析 (2):格文法,格フレーム,選択制限,語彙意味論,時空間の表現 | |
第10回 | 意味解析 (3):語義曖昧性解消,意味役割付与 | |
第11回 | 談話解析 (1):語用論,言語行為論,グライスの格率,間接発話行為 | |
第12回 | 談話解析 (2):参照解析,中心化理論 | |
第13回 | 談話解析 (3):談話構造,談話構造解析,修辞構造理論,対話処理 | |
第14回 | 言語資源:コーパス,辞書,アノテーション | |
第15回 | 言語生成:テキスト・プランニング,マイクロ・プランニング,表層化 |
特に指定しない.
ハンドアウトを配布する.
Pierre M. Nugues, Language Processing with Perl and Prolog, 2nd ed. Springer (2014).
Jurafsky, D. & Martine, J. H.: Speech and Language Processing (2nd ed.), Prentice Hall (2009).
Allen, J.: Natural Language Processing 2nd ed., Benjamin (1994).
レポート課題の出来ばえによって評価する.
プログラミングができること.
特になし.