データ工学は,データベース処理に代表されるような,格納された不揮発の大量データに対する高度処理に関する研究分野で,計算機システムの大きな利用分野の一つである。大量データを対象とするため,高速化が重要であり,いろいろなレベルで並列/分散化等の試みが行われている。本講義では,大量データ処理のためメカニズム,アルゴリズム,アーキテクチャについて評論する。
データ工学は、データベース処理に代表されるような、格納された大量データに対する
高度な処理に関する研究分野であり、計算機システムの大きな利用分野の一つである。
大量のデータを対象とするため、いろいろなレベルでの高速化、高機能化のアプローチ
が行われている。本講では、大量データ処理のため最新のメカニズム、アルゴリズム、
アーキテクチャ等について紹介する。
1. データ工学の基本概念
2. トランザクションモデル
3. トランザクションログの解析・マイニング
4. データウェアハウスとOLAP
5. 先進インデックス手法
6. データベース演算のコスト評価
7. データベース演算の並列化(1)
8. データベース演算の並列化(2)
9. 負荷均等化のアプローチ
10. データのリプリケーションと障害回復
11. ストレージシステム
12. 分散トランザクション
13. ワークフロー管理システム
参考書等
1. Transaction Processing: Concept and Techniques Jim Gray and Andreas Reuter Morgan
Kaufmann Publishers, 1993.(邦訳:トランザクション処理-概念と技法-(上下)、日
経BP,2001)
←データベース(学部), 計算機アーキテクチャ第1(学部),計算機アーキテクチャ第
2(学部)
期末試験または期末レポートにより評価する.
特になし
知識ユニット
トランザクションモデル,データウェアハウスとOLAP,インデックス手法,並列デー
タベース演算,データリプリケーションと障害回復,ストレージシステム,ワークフロ
ー管理システム,XMLデータベース