本講義はテキスト情報に焦点を当てて,情報の利活用に必要な組織化と検索の基礎概念および応用技術について解説する.講義内容は,情報検索と関連技術に大別される.情報検索編は情報検索システムを支える技術とその評価方法に細分化され,関連技術編は情報フィルタリング,文書分類,クラスタリング,ウェブマイニング,推薦システムからなる.
情報検索システムを支える技術とそれらの評価手法を通して,情報検索システムの内部を透視するための知識と技能を教授する.自然言語処理やウェブマイニングといった人工知能研究との関係を明確にする.
受講生が以下の項目について説明できるようになること.
(a)情報検索におけるユーザとコンピュータの対話的な情報処理
(b)情報検索システムの構成と各要素に必要な技術
(c)情報検索の評価に関する実験方法,使用するデータ,実験結果の解釈と提示
(d)情報検索および情報組織化の関連技術
情報検索,情報組織化,情報要求,索引付け,検索モデル,適合性フィードバック,テストコレクション,情報フィルタリング,文書分類,クラスタリング,ウェブマイニング,推薦システム,自然言語処理,人工知能
✔ 専門力 | 教養力 | コミュニケーション力 | 展開力(探究力又は設定力) | 展開力(実践力又は解決力) |
講義資料はプレゼンテーションのスライドとして編集されおり,スライドごとに以下の手順を繰り返す.①プロジェクターで投影された内容の筆記 ②解説を聞く ③質疑応答および追加の演習.なお,講義資料は配布しないので,スクリーンに投影された内容を各自で筆記すること.ただし,受講者全員が書き取るまで次のスライドには進行しない.
授業計画 | 課題 | |
---|---|---|
第1回 | 情報検索への導入 | 情報検索について人間の行為およびコンピュータシステムとの対話的処理として説明できる. |
第2回 | 情報要求 | 情報要求について検索質問との関係を踏まえて説明できる. |
第3回 | 索引付け | 索引付けの目的および手順について説明できる. |
第4回 | 索引語の抽出 | 文字や単語といった索引語の種類および抽出方法について説明できる. |
第5回 | 索引語の重み付け | 索引語重みの動機および効果について説明できる. |
第6回 | ブーリアンモデル | ブーリアンモデルの概念,実装,実行過程について説明できる. |
第7回 | ベクトル空間モデル | ベクトル空間モデルの概念,実装,実行過程について説明できる. |
第8回 | 適合性フィードバック | 適合性フィードバックの概念と実装について説明できる. |
第9回 | 情報検索の評価 | 情報検索の評価について動機,目的,方法の観点から説明できる. |
第10回 | 情報検索テストコレクション | 情報検索の評価におけるテストコレクションの役割について説明できる. |
第11回 | 実験結果の見せ方と読み方 | 情報検索の評価における代表的な評価尺度を用いて実験結果の読み方や見せ方を説明できる. |
第12回 | 情報検索の関連技術 | 情報フィルタリングや文書分類について情報検索との関連を踏まえて説明できる. |
第13回 | ウェブマイニング | ウェブマイニングについて内容,構造,利用の観点から説明できる. |
第14回 | ウェブ検索モデル | ウェブマイニングを応用したウェブ検索のモデルについて説明できる. |
第15回 | 推薦システム | 推薦システムに関する種々の方法論とそれらの得失について説明できる. |
なし.
徳永健伸,情報検索と言語処理,東京大学出版会,1999.
Manning, C. D., Raghavan, P, and Schutze, H. Introduction to Information Retrieval, Cambridge University Press, 2008.
Liu, B. Web Data Mining, Springer, 2007.
筆記試験による: 中間試験(50%)と期末試験(50%)
なし.