コンピュータで利用可能な情報が爆発的に増加しており、その情報の利用は、Web検索だけでなく、経済動向の解析や、生物学、物理学等の科学研究にも大きな影響を及ぼしている。現在、その莫大なデータの効率的な管理や計算方法が大きな課題となっており、この課題の解決が巨大なデータの有効利用につながることが期待されている。そのため、様々な最新の高性能ハードウェアを利用した並列計算機システムを利活用して、この問題の解決に向けて取り組まれている。
本講義では、巨大なデータの効率的な処理法に関して、最近の新しい並列計算のための概念や技術を学習する。
最新の高性能ハードウェアを利用した計算機システムを利活用することを目的に、マクロな観点からクラウドコンピューティングを、ミクロな観点からメニーコアプロセッサ向けのデータ管理に焦点を当て、最近の並列処理の計算モデルやアルゴリズムの概念、技術を習得する。
1. 導入
2. キーバリューストア、データモデル
3. クラウド環境での一貫性モデル
4. MapReduceフレームワーク
5. MapReduceとテキスト処理
6. MapReduceとグラフアルゴリズム
7. メモリ階層と高性能計算
8. キャッシュ指向データ配置
9. キャッシュ指向探索アルゴリズム
10. アトミック操作、同期
11. ロックフリーアルゴリズム(1)
12. ロックフリーアルゴリズム(2)
13. ソフトウェアトランザクショナルメモリ
14. ハードウェアトランザクショナルメモリ
15. 先端的事例
参考書:
1. J. Lin, C. Dyer, "Data-Intensive Text Processing with MapReduce", Morgan & Claypool Publisher, 2010
2. T. Harris, J. Larus, R. Rajwar, "Transactional Memory", 2nd edition, Morgan & Claypool Publisher, 2010
関連科目: 計算機アーキテクチャ特論、データ工学特論、並行システム論
期間中に出される課題と期末試験により評価する