知識資源活用(発展編)   Advanced Utilization of Large Scale Knowledge Resources

文字サイズ 

担当教員
中川 正宣  赤間 啓之  八木 伸行  栗山 健  中村 隆宏 
使用教室
月7-8(W9-202)  
単位数
講義:2  演習:0  実験:0
講義コード
65054
シラバス更新日
2009年9月28日
講義資料更新日
2009年9月28日
学期
後期

講義概要

インターネットを介した百科事典や辞書と,その検索システムあるいは映像資源データベースの構築や運用,それらの言語資源に基づく統計解析の方法や,解析結果の応用等について,実際の研究や業務に携わっている複数の産業界の担当者を講師として交え,オムニバス形式で授業を進める。

講義の目的

本学教員と企業の研究者を講師とする産学連携授業で、主に大規模知識資源(言語コーパス、音声や映像データ)やその統計解析結果の産業界における具体的応用を中心として、授業を行う。

具体的には、インターネットを介した百科事典や辞書と、その検索システムあるいは映像資源データベースの構築や運用、それらの言語資源に基づく統計解析の方法や、解析結果の応用、等について、実際の研究や業務に携わっている複数の産業界の担当者を講師として交え、オムニバス形式で授業を進める。

講義計画

以下の内容で授業を行う。
〇言語統計解析に基づく比喩理解・生成モデルの構築について。(中川正宣:人間行動システム専攻)
〇情報検索や情報集約における語彙の相互情報量の応用事例紹介
相互情報量(Mutual Information)の考え方は非常に単純だが、個々の応用局面においては、効果をあげる場合がある。それぞれの応用事例を紹介しながら、その得失を考える。
(1)コーパスからの共起表作成(2)コーパスからの教育用語彙の抽出(3)百科事典本文におけるリンク用キーワードの評価(4)辞事典検索における全文検索結果のページランク手法
小学館における”百科データベース計画”とDBPedia(Wikipediaの派生プロジェクト)の紹介(中村隆宏:株式会社小学館)
〇映像アーカイブス
NHKアーカイブスを例に、映像コンテンツの蓄積・活用システムについて解説する。この中で、映像資源を利活用するため課題・技術、特に、キーとなるメタデータ技術、検索・活用技術、コンテンツ保護技術について、説明する。(八木伸行:NHK放送技術研究所)
〇テキストマイニングの基本的な方法を、具体的な言語資源を用いて説明する。(赤間啓之:人間行動システム専攻)
〇「日露戦争をめぐる情報戦 ー歴史史料学の観点からー」
日露戦争については、終結後百年を経てもなお評価が定まっているとは言い難い。当時、日本側では「ロシア脅威論」が喧伝される一方、ロシア側では「黄禍論」が高まり、激しい政治宣伝が繰り広げられていたことが知られている。講義では、日本の参謀本部が画策したロシア脅威論の背景を、歴史データの探索と分析を通して検証する。現代の情報史の観点から、歴史データの収集方法の意義を紹介する。(早坂真理:人間行動システム専攻)
〇パソコン、専用機器、携帯電話など様々なデバイスで利用できる電子辞書、パソコンでの利用を中心とした学習デジタルコンテンツを対象とし、その開発背景と技術的要件、利活用について考察する。また可能な範囲でビジネスモデルについても触れる。(栗山健:株式会社学習研究社)
〇ソフトウェア工学。高品質のソフトウェアを開発する技術の中で、特に要求分析と呼ばれる顧客やユーザから要求を獲得し、仕様としてまとめあげる種々の技術を概説する。(佐伯元司:計算工学専攻)
〇日本語学習支援システム「あすなろ」「なつめ」において利用するICT技術とコーパスについて概説することで、大規模知識資源活用の意義を述べる。(仁科喜久子:留学生センター・人間行動システム専攻)

教科書・参考書等

特になし

参考書等
特になし

関連科目・履修の条件等

特になし

成績評価

出席

このページのトップへ