最近の多数コアプロセッサやGPUなどの高性能アーキテクチャ及びそれらの性能を引き出すための技法(プログラミング技法及びコード最適化方法,チューニング方法等)について学ぶ
講義のねらいは2つある.まず、多数コアプロセッサやGPUをはじめとする高性能アーキテクチャを理解できるようになることである.
次に,それらの性能を引き出すためのソフトウェア技法(プログラミング技法及びコード最適化方法,チューニング方法等)を理解できるようになることである.
本講義を履修することによって次の知識を修得する。
‐ 多数コアプロセッサによる並列計算と高性能化技法
‐ GPUによる並列計算と高性能化技法
並列計算,高性能計算,多数コアプロセッサ,GPU
✔ 専門力 | 教養力 | コミュニケーション力 | 展開力(探究力又は設定力) | 展開力(実践力又は解決力) |
1) 毎回の講義の前半で,前回の復習を行います。
2) 講義の後半で,その日の授業内容に関する演習問題に取り組んでもらいます。
3) 各回の授業内容をよく読み,課題を予習・復習で行って下さい。
授業計画 | 課題 | |
---|---|---|
第1回 | 多数コアプロセッサと並列計算 | 多数コアプロセッサと並列計算の概要について理解できるようになる |
第2回 | 多数コアプロセッサのための高性能化技法 | 多数コアプロセッサのための代表的な高性能化技法について理解できるようになる |
第3回 | GPUアーキテクチャとGPGPU | GPUの様々なアーキテクチャを理解し、次にGPGPUについて理解できるようになる |
第4回 | 並列計算・ベクトル計算とスレッドプログラミングモデル | スレッドプログラミングモデルによるベクトル計算・並列計算を理解できるようになる |
第5回 | GPUのメモリ構成とデータ転送 | GPUのメモリ構成とデータ転送について理解できるようになる |
第6回 | プログラムの定量評価 | プログラムの代表的な定量評価方法について理解できるようになる |
第7回 | 高性能化のためのチューニング方法 | GPUプログラムの高性能化のためのチューニング方法について理解できるようになる |
第8回 | その他のチューニング方法 | GPUプログラムの様々なチューニング方法について理解できるようになる |
指定なし
講義資料は講義中に配布する(OCW-iにもアップします).
1) 多数コアプロセッサによる並列計算と高性能化技法についての理解度,GPUによる並列計算と高性能化技法についての理解度により評価
2) 配点は,期末試験(80%),演習(20%)
3) 全出席が原則である.
4) 遅刻や再提出を繰り返した場合は不合格とすることがある
履修の条件を設けないが,
コンピュータのハードウェア及びソフトウェアについての基礎知識を有していることが望ましい.