2021年度 データサイエンスのための統計   Statistics for Data Science

文字サイズ 

アップデートお知らせメールへ登録 お気に入り講義リストに追加
開講元
工学院
担当教員名
BERRAR DANIEL PETER 
授業形態
講義     
メディア利用科目
曜日・時限(講義室)
月9-10(W611)  木9-10(W611)  
クラス
-
科目コード
XEG.G301
単位数
2
開講年度
2021年度
開講クォーター
3Q
シラバス更新日
2021年3月19日
講義資料更新日
-
使用言語
英語
アクセスランキング
media

講義の概要とねらい

この講義では、データサイエンスのための確率と統計の基礎を学びます。確率については、離散・連続確率変数、確率の規則、重要な確率分布、期待値を扱います。講義では、頻度主義の考え方だけでなく、ベイズ統計学も紹介します。頻度主義統計については、標本分布、母数の推定、信頼区間と優位性検定を、ベイズ統計については、 ベイズの定理、ベイズデータ分析、ベイズ統計の区間推定 を学びます。この講義の目的は、学生が科学的にデータを分析するための適切な統計手法や道具を選択することができるようになることです。この講義の目的を達成するために、この講義では工学と理学から多くの現実の例を扱います。

到達目標

この講義の内容を修得すると,学生は
(1) 様々なグラフで表現された統計学的情報を解釈する方法を理解します.
(2) 確率や統計の鍵となる要素を理解します.
(3) 適切な統計学的手法や道具を用いて科学的にデータを解析できるようになります.
(4) 学際的な環境において解析結果をきちんと伝えることができます.

キーワード

ベイズの定理、 ベイズ仮説検定、 ベータ機能、二項確率分布、 条件付き確率、信頼区間、信頼区間、データサイエンス、 期待値、 ガンマ関数、 仮説検定、 同時確率、 限界確率、ナイーブベイズ分類器、 確率分布、 パワー、 p値、ランダム変数、 標本分布、 有意性テスト

学生が身につける力(ディグリー・ポリシー)

専門力 教養力 コミュニケーション力 展開力(探究力又は設定力) 展開力(実践力又は解決力)

授業の進め方

この講義では,統計学の概念に興味を持ってもらうために現実世界における例題から通常始めます.
この統計学の概念は必要に応じて数学的な証明を行いながら説明します.
なお,講師と学生は相互に対話しながら現実世界の問題を解決していきます.
学生の積極的な参加を期待します.

授業計画・課題

  授業計画 課題
第1回 導入、 データサイエンスの基礎、 共分散、相関係数、回帰 特に無し。
第2回 条件付き確率、ベイズ定理 前回の講義について復習を行い、宿題を提出すること.
第3回 離散確率変数、期待値 前回の講義について復習を行い、宿題を提出すること.
第4回 ガンマ関数、 二項確率分布 前回の講義について復習を行い、宿題を提出すること.
第5回 連続確率変数、連続確率分布、正規確率分布 前回の講義について復習を行い、宿題を提出すること.
第6回 ランダム変数の関数の分布, 標本化分布 前回の講義を復習し、宿題を提出すること.
第7回 母数の推定と信頼区間 前回の講義について復習を行い、宿題を提出すること.
第8回 t分布 前回の講義について復習を行い、宿題を提出すること.
第9回 検定規範、P値 前回の講義について復習を行い、宿題を提出すること.
第10回 Hypothesis testing 前回の講義について復習を行い、宿題を提出すること.
第11回 ベータ機能、 ベイズ分析 前回の講義について復習を行い、宿題を提出すること.
第12回 ベイズ分析 [1/2] 前回の講義について復習を行い、宿題を提出すること.
第13回 ベイズ分析 [2/2] 前回の講義について復習を行い、宿題を提出すること.
第14回 統計学習理論の基礎 [1/2] 前回の講義について復習を行い、宿題を提出すること.

授業時間外学修(予習・復習等)

学修効果を上げるため,教科書や配布資料等の該当箇所を参照し,「毎授業」授業内容に関する予習と復習(課題含む)をそれぞれ概ね100分を目安に行うこと。

教科書

特に無し.
講義の最中に資料を配付する.

参考書、講義資料等

Bertsekas D.P. and Tsitsiklis J.N. (2008) Introduction to Probability. Athena Scientific; 2nd edition; ISBN: 978-1-886529-23-6.

Kruschke J. (2014) Doing Bayesian Data Analysis. Academic Press, 2nd edition, ISBN-10: 0124058884.

成績評価の基準及び方法

期末試験で評価する.

関連する科目

  • XCO.T483 : 応用AI・データサイエンスA
  • IEE.A205 : 経営・経済のための統計
  • ICT.M202: Probability and Statistics (ICT)
  • XCO.T487 : 基盤データサイエンス

履修の条件(知識・技能・履修済科目等)

初等的な代数学と微積分学の知識が必要.

このページのトップへ