2018年度 生命情報解析   Biological Data Analysis

文字サイズ 

アップデートお知らせメールへ登録 お気に入り講義リストに追加
開講元
情報工学系
担当教員名
秋山 泰  山村 雅幸 
授業形態
講義
メディア利用
 
曜日・時限(講義室)
火7-8(H121)  金7-8(H121)  
クラス
-
科目コード
CSC.T353
単位数
2
開講年度
2018年度
開講クォーター
2Q
シラバス更新日
2018年3月20日
講義資料更新日
-
使用言語
日本語
アクセスランキング
media

講義の概要とねらい

 本講義では,爆発的に増加しつつある遺伝子配列やタンパク質構造などの生命情報について,コンピュータ上でデータとして表現・交換するための様々な手法と,そのデータを用いた比較解析,知識抽出などのアルゴリズムの基礎的な例を取り扱う。動的計画法に基づく2本の配列間の最適アラインメントの問題からスタートし,データベースに対する大量検索の場合に用いる高速化手法などを説明する。また多くの配列間の関係を同時に考慮する多重アラインメントや系統樹推定では,厳密解法では本数の増加に対して指数関数的な計算量が必要となることから各種の近似解法が重要であることを説明する。本講義では,生物学や生化学の事前知識は一切仮定せず,これらについて最小限の入門的な知識を与えた上で,アルゴリズムや計算量といった情報工学的な観点から考察する。
 生命科学の急速な発展にともない,生物学・医学・薬学等の分野では,多種類で不均質なデータが大量に得られつつある。生命情報のコンピュータ解析は21世紀の人々の暮らしの向上にきわめて重要であり,情報工学者としても基盤的な理解は身に付けて欲しい。ここで学ぶ手法は,生命情報のみならず実世界の多様なデータの解析と知識抽出に対して適用可能であるため,情報工学で学ぶ手法が実世界にどう応用されるのか,例示を通じて理解を進める効果を狙っている。

到達目標

 本講義を履修することによって次の能力を修得する。
1)配列データを表現する各種のモデル(正規表現,プロファイル行列,隠れマルコフモデル)を説明できる
2)動的計画法のアルゴリズムを説明でき,それが用いられる複数の実応用を説明できる
3)多重アラインメントや進化系統樹推定では近似解法が重要であることを計算量の観点から説明できる
4)配列データベースに対する相同性検索におけるE値とP値の意味を説明でき,値を求めることができる
5)大規模なデータベースに対する相同性検索の高速化手法について説明できる
6)タンパク質等の立体構造データの表現や,構造予測の手法などについて説明できる

キーワード

生命情報,アルゴリズム,計算量,動的計画法,隠れマルコフモデル,遺伝子,タンパク質

学生が身につける力(ディグリー・ポリシー)

専門力 教養力 コミュニケーション力 展開力(探究力又は設定力) 展開力(実践力又は解決力)

授業の進め方

座学による講義を通じて,各回の内容を解説します。講義の後半で,その日の内容に関する演習問題を解いてもらいます。

授業計画・課題

  授業計画 課題
第1回 生命情報とその意義  -情報工学から見た遺伝子,ゲノム,タンパク質,細胞,個体 階層性の理解,スケールの比較,情報量
第2回 大域的配列アラインメント  -経路探索問題,動的計画法,大域的配列アラインメント 動的計画法による大域的配列アラインメントの計算
第3回 局所的配列アラインメント  -タンパク質,アミノ酸配列,局所的配列アラインメント 動的計画法による局所的配列アラインメントの計算
第4回 多重配列アラインメント  -多重アラインメントの計算量,ヒューリスティックな手法 スター法やツリーベース法による多重配列アラインメントの計算
第5回 進化系統樹推定  -距離行列法,形質状態法,系統樹の確からしさ UPGMA法やNJ法による進化系統樹の計算
第6回 データベースからの相同性検索  -アミノ酸置換行列,ヒットの有意性,e値,ビットスコア,p値 データベース検索におけるヒットのe値およびp値の計算
第7回 相同性検索の高速化  -FASTA,BLAST,PSI-BLAST 探索表による部分文字列の高速検索
第8回 モチーフの表現と抽出  -正規表現,プロファイル行列,隠れマルコフモデル モチーフ配列の各種モデルによる表現法の理解
第9回 確率モデルによる配列解析  -遺伝子領域予測,マルコフモデル 確率モデルによる配列解析法の理解
第10回 RNA二次構造予測  -RNAの二次構造,Nussinovアルゴリズム,Zuker法 動的計画法によるRNA二次構造予測
第11回 ゲノム配列比較  -さらなる高速化の要求,BLAT,RMAP 近似による高速な配列比較手法の理解
第12回 タンパク質二次構造予測  -タンパク質二次構造,DSSPコード,ニューラルネット,PSI-PRED タンパク質二次構造予測法の理解
第13回 "タンパク質立体構造予測  -ホモロジーモデリング,フォールド認識法,フラグメントアセンブリ法" タンパク質立体構造予測  -ホモロジーモデリング,フォールド認識法,フラグメントアセンブリ法 タンパク質立体構造予測法の理解
第14回 遺伝子発現とネットワーク推定  -遺伝子発現,DNAマイクロアレイ,遺伝子制御ネットワーク 遺伝子制御ネットワーク推定法の理解
第15回 化合物代謝とネットワーク推定  -生体内での化合物代謝,代謝パスウェイの推定 代謝パスウェイ推定法の理解

教科書

独自配布のスライド資料を用いる

参考書、講義資料等

バイオインフォマティクス学会編 『バイオインフォマティクス入門』 慶應義塾大学出版会, ISBN:978-4-7664-2251-1

成績評価の基準及び方法

生命情報解析における各種データ表現法,アルゴリズム,応用等に関して,その理解度を評価
配点は,期末試験(80%),演習(20%)

関連する科目

  • 特になし

履修の条件(知識・技能・履修済科目等)

特になし

このページのトップへ