本講義では,爆発的に増加しつつある遺伝子配列やタンパク質構造などの生命情報について,コンピュータ上でデータとして表現・交換するための様々な手法と,そのデータを用いた比較解析,知識抽出などのアルゴリズムの基礎的な例を取り扱う。動的計画法に基づく2本の配列間の最適アラインメントの問題からスタートし,データベースに対する大量検索の場合に用いる高速化手法などを説明する。また多くの配列間の関係を同時に考慮する多重アラインメントや系統樹推定では,厳密解法では本数の増加に対して指数関数的な計算量が必要となることから各種の近似解法が重要であることを説明する。後半では、生物の細胞システム内のさまざまな挙動をシステム的に捉える見方を紹介し、アナログおよびデジタルシミュレーションの基本的な諸手法を紹介する。本講義では,生物学や生化学の事前知識は一切仮定せず,これらについて最小限の入門的な知識を与えた上で,アルゴリズムや計算量といった情報工学的な観点から考察する。
生命科学の急速な発展にともない,生物学・医学・薬学等の分野では,多種類で不均質なデータが大量に得られつつある。生命情報のコンピュータ解析は21世紀の人々の暮らしの向上にきわめて重要であり,情報工学者としても基盤的な理解は身に付けて欲しい。ここで学ぶ手法は,生命情報のみならず実世界の多様なデータの解析と知識抽出に対して適用可能であるため,情報工学で学ぶ手法が実世界にどう応用されるのか,例示を通じて理解を進める効果を狙っている。
本講義を履修することによって次の能力を修得する。
1)配列データを表現する各種のモデル(正規表現,プロファイル行列,隠れマルコフモデル)を説明できる
2)動的計画法のアルゴリズムを説明でき,それが用いられる複数の実応用を説明できる
3)多重アラインメントや進化系統樹推定では近似解法が重要であることを計算量の観点から説明できる
4)配列データベースに対する相同性検索におけるE値とP値の意味を説明でき,値を求めることができる
5)大規模なデータベースに対する相同性検索の高速化手法について説明できる
6)細胞内での各反応をシステム的に捉えるため、微分方程式等を使ったアナログシミュレーション、およびデジタルシミュレーションの基本的手法について説明できる
生命情報,配列解析, 動的計画法,隠れマルコフモデル,アナログ・シミュレーション, デジタル・シミュレーション
✔ 専門力 | 教養力 | コミュニケーション力 | ✔ 展開力(探究力又は設定力) | 展開力(実践力又は解決力) |
座学による講義を通じて,各回の内容を解説します。講義の後半で,その日の内容に関する演習問題を解いてもらいます。
授業計画 | 課題 | |
---|---|---|
第1回 | 配列アラインメント -経路探索問題,動的計画法,大域的配列アラインメント, 局所的配列アラインメント | 動的計画法による大域的および局所的配列アラインメントの計算 |
第2回 | 多重配列アラインメント -多重アラインメントの計算量,ヒューリスティックな手法 | スター法やツリーベース法による多重配列アラインメントの計算 |
第3回 | 進化系統樹推定 -距離行列法,形質状態法,系統樹の確からしさ | UPGMA法やNJ法による進化系統樹の計算 |
第4回 | データベースからの相同性検索 -アミノ酸置換行列,ヒットの有意性,e値,ビットスコア,p値 | データベース検索におけるヒットのe値およびp値の計算 |
第5回 | 相同性検索の高速化 -FASTA,BLAST,and PSI-BLAST | 探索表による部分文字列の高速検索 |
第6回 | モチーフの表現と抽出 -正規表現,プロファイル行列,隠れマルコフモデル | モチーフ配列の各種モデルによる表現法の理解 |
第7回 | タンパク質の構造解析 -二次構造,三次構造,分子シミュレーション | タンパク質の二次構造・三次構造および解析手法に関する理解 |
第8回 | 細胞システムのアナログ・シミュレーション (1) | 各授業で示す |
第9回 | 細胞システムのアナログ・シミュレーション (2) | 各授業で示す |
第10回 | 細胞システムのアナログ・シミュレーション (3) | 各授業で示す |
第11回 | 細胞システムのデジタル・シミュレーション (1) | 各授業で示す |
第12回 | 細胞システムのデジタル・シミュレーション (2) | 各授業で示す |
第13回 | 細胞システムのデジタル・シミュレーション (3) | 各授業で示す |
第14回 | 生命シミュレーションに関する発展的話題 | 各授業で示す |
第15回 | 期末試験 |
独自配布のスライド資料を用いる
バイオインフォマティクス学会編 『バイオインフォマティクス入門』 慶應義塾大学出版会, ISBN:978-4-7664-2251-1
生命情報解析における各種データ表現法,アルゴリズム,応用等に関して,その理解度を評価
配点は,期末試験(80%),演習(20%)
特になし