2022年度 生命情報解析   Biological Data Analysis

文字サイズ 

アップデートお知らせメールへ登録 お気に入り講義リストに追加
開講元
情報工学系
担当教員名
秋山 泰  山村 雅幸  瀧ノ上 正浩 
授業形態
講義    (ハイフレックス型)
メディア利用科目
曜日・時限(講義室)
火7-8(W641)  金7-8(W641)  
クラス
-
科目コード
CSC.T353
単位数
2
開講年度
2022年度
開講クォーター
2Q
シラバス更新日
2022年3月28日
講義資料更新日
-
使用言語
日本語
アクセスランキング
media

講義の概要とねらい

本講義では、爆発的に増加しつつある遺伝子配列やタンパク質構造などの生命情報について、コンピュータ上でデータとして表現・交換するための様々な手法と、そのデータを用いた比較解析、知識抽出などのアルゴリズムの基礎的な例を取り扱う。秋山によるパート(火曜日)では、動的計画法に基づく2本の配列間の最適アラインメントの問題からスタートし、データベースに対する大量検索の場合に用いる高速化手法などを説明する。また多くの配列間の関係を同時に考慮する多重アラインメントや系統樹推定では、厳密解法では本数の増加に対して指数関数的な計算量が必要となることから各種の近似解法が重要であることを説明する。山村・瀧ノ上によるパート(金曜日)では、生物の細胞システム内のさまざまな挙動をシステム的に捉える見方を紹介し、アナログおよびデジタルシミュレーションの基本的な諸手法を紹介する。本講義では、生物学や生化学の事前知識は一切仮定せず、これらについて最小限の入門的な知識を与えた上で、アルゴリズム、計算量、非線形システム解析、数値シミュレーションといった情報工学的な観点から考察する。
 生命科学の急速な発展にともない、生物学・医学・薬学等の分野では、多種類で不均質なデータが大量に得られつつある。生命情報のコンピュータ解析は21世紀の人々の暮らしの向上にきわめて重要であり、情報工学者としても基盤的な理解は身に付けて欲しい。ここで学ぶ手法は、生命情報のみならず実世界の多様なデータの解析と知識抽出に対して適用可能であるため、情報工学で学ぶ手法が実世界にどう応用されるのか、例示を通じて理解を進める効果を狙っている。

到達目標

 本講義を履修することによって次の能力を修得する。
1)配列データを表現する各種のモデル(正規表現,プロファイル行列,隠れマルコフモデル)を説明できる
2)動的計画法のアルゴリズムを説明でき,それが用いられる複数の実応用を説明できる
3)多重アラインメントや進化系統樹推定では近似解法が重要であることを計算量の観点から説明できる
4)配列データベースに対する相同性検索におけるE値とP値の意味を説明でき,値を求めることができる
5)大規模なデータベースに対する相同性検索の高速化手法について説明できる
6)細胞内での各反応をシステム的に捉えるため、微分方程式等を使ったアナログシミュレーション、およびデジタルシミュレーションの基本的手法について説明できる

キーワード

生命情報,配列解析, 動的計画法,隠れマルコフモデル,アナログ・シミュレーション, デジタル・シミュレーション

学生が身につける力(ディグリー・ポリシー)

専門力 教養力 コミュニケーション力 展開力(探究力又は設定力) 展開力(実践力又は解決力)

授業の進め方

座学による講義を通じて,各回の内容を解説します。講義の後半で,その日の内容に関する演習問題を解いてもらいます。

授業計画・課題

  授業計画 課題
第1回 配列アラインメント(秋山)  -経路探索問題,動的計画法,大域的配列アラインメント, 局所的配列アラインメント 動的計画法による大域的および局所的配列アラインメントの計算
第2回 細胞システムのシミュレーションのための基礎知識(山村・瀧ノ上) 分子生物学・数理生物学の基本の紹介
第3回 多重配列アラインメント(秋山)  -多重アラインメントの計算量,ヒューリスティックな手法 スター法やツリーベース法による多重配列アラインメントの計算
第4回 細胞システムのアナログ・シミュレーション (1)(山村・瀧ノ上) 非線形微分方程式・MATLAB
第5回 進化系統樹推定(秋山)  -距離行列法,形質状態法,系統樹の確からしさ UPGMA法やNJ法による進化系統樹の計算
第6回 細胞システムのアナログ・シミュレーション (2)(山村・瀧ノ上) 非線形微分方程式と非線形システム解析
第7回 データベースからの相同性検索(秋山)  -アミノ酸置換行列,ヒットの有意性,e値,ビットスコア,p値 データベース検索におけるヒットのe値およびp値の計算
第8回 細胞システムのアナログ・シミュレーション (3)(山村・瀧ノ上) 代表的な非線形システム
第9回 相同性検索の高速化(秋山)  -FASTA,BLAST,and PSI-BLAST 探索表による部分文字列の高速検索
第10回 細胞システムのデジタル・シミュレーション (1)(山村・瀧ノ上) 確率シミュレーション1
第11回 モチーフの表現と抽出(秋山)  -正規表現,プロファイル行列,隠れマルコフモデル モチーフ配列の各種モデルによる表現法の理解
第12回 細胞システムのデジタル・シミュレーション (2)(山村・瀧ノ上) 確率シミュレーション2
第13回 タンパク質の構造解析(秋山)  -二次構造,三次構造,分子シミュレーション タンパク質の二次構造・三次構造および解析手法に関する理解
第14回 生命シミュレーションに関する発展的話題(山村・瀧ノ上) 代表的な生命シミュレーション(遺伝子ネットワーク、分子コンピューティング)

授業時間外学修(予習・復習等)

学修効果を上げるため,教科書や配布資料等の該当箇所を参照し,「毎授業」授業内容に関する予習と復習(課題含む)をそれぞれ概ね100分を目安に行うこと。

教科書

独自配布のスライド資料を用いる

参考書、講義資料等

バイオインフォマティクス学会編 『バイオインフォマティクス入門』 慶應義塾大学出版会, ISBN:978-4-7664-2251-1

成績評価の基準及び方法

生命情報解析における各種データ表現法,アルゴリズム,応用等に関して,その理解度を評価
配点は,期末試験(80%),演習(20%)

関連する科目

  • CSC.T362 : 数値計算法

履修の条件(知識・技能・履修済科目等)

特になし

このページのトップへ