本講義では,特定の主題に関する情報を容易に発見できるようにするための方法として,組織化および検索技術について講述する.前半では,代表的な分類法の紹介と共に,分類の基礎および機械学習による分類法について説明する.これに加えて,識別子やレコードの同定など,情報の組織化を行う上で必要な知識や技術についても説明を行う.後半では,情報検索技術について詳細に説明をする.基礎的な検索モデルや情報検索技術の評価方法について説明し,その後に,ランキング学習やオンライン評価など,現代の検索システムにて用いられている最新の技術について講義および議論を行う.各種技術について,Pythonなどを用いた演習も行う.
情報の組織化と検索の基本的な考え方や概念を理解し,演習を通してこれらを実践できるようになることを目標とする.
情報組織化,情報検索,分類,機械学習,メタデータ
✔ 専門力 | 教養力 | コミュニケーション力 | 展開力(探究力又は設定力) | 展開力(実践力又は解決力) |
情報の組織化と検索の基礎・応用・実践について講義資料とプログラミング演習を用いて講義する.
授業計画 | 課題 | |
---|---|---|
第1回 | 分類の基礎 | 分類の定義,分類体系について学ぶ. |
第2回 | 主な分類法とその利用 | 手法な分類法について学ぶ. |
第3回 | 文書分類(1) | 機械学習によって文書分類を行う方法について学ぶ. |
第4回 | 文書分類(2) | 機械学習によって文書分類を行う方法について学ぶ. |
第5回 | 文書分類 演習 | Pythonを用いた文書分類の演習を行う. |
第6回 | 識別子と同定(1) | 識別子の種類や特徴について学ぶ. |
第7回 | 識別子と同定(2) | レコード同定の技術について学ぶ. |
第8回 | 情報検索の基礎(1) | 転置索引,および,ブーリアンモデルなどの基本的な検索モデルについて学ぶ. |
第9回 | 情報検索の基礎(2) | ベクトル空間モデルや確率モデルなどの基本的な検索モデルについて学ぶ. |
第10回 | 情報検索の評価 | 評価用テストコレクションの構築方法や評価指標について学ぶ. |
第11回 | 情報検索 演習 | Elasticsearchを用いた情報検索の演習を行う. |
第12回 | ランキング学習(1) | 機械学習によってランキングを行う方法について学ぶ. |
第13回 | ランキング学習(2) | 機械学習によってランキングを行う方法について学ぶ. |
第14回 | オンライン評価 | 実サービスにおいて検索システムを評価する方法について学ぶ. |
学修効果を上げるため,教科書や配布資料等の該当箇所を参照し,「毎授業」授業内容に関する予習と復習(課題含む)をそれぞれ概ね100分を目安に行うこと。
なし
講義資料はWebサイトから提供する。
[参考書]
1. 本を分類する.勁草書房,1996.
2. 情報資源組織論.樹村房,2011.
3. 知識資源のメタデータ.勁草書房,2007.
4. 情報検索の基礎.共立出版,2012.
5. 言語処理のための機械学習入門.コロナ社,2010.
演習内容(ソースコード,50%)と課題(レポート内容,50%)を元に評価する。
なし
なし