統計分析(S) Rを活用した実践的統計・データ分析

講座の趣旨

  • 統計学を深く正確に理解するとともに、実務で活用できるような実践力を身に付けることを目指します。
  • 統計の各種手法について、数学的背景をふまえて体系的に講義し、実践的な演習を行います。
  • 演習ではプログラミング言語「R」を使用します。

到達目標

  • 推定、検定、回帰分析、判別分析、主成分分析、多次元尺度構成法、時系列解析などの主要な統計的手法を活用して、データ分析を行うことができる。
  • 新しい課題に対してでも、データ活用の設計、分析手法の選択と実行、分析結果の解釈、業務への活用の提案など、一連の業務を適切に行えるようになる。

数学レベル

  • 高校までの理系数学と大学1年生レベルの偏微分、積分について、あらかじめある程度知っていることが望ましいです。

カリキュラム

  1. Rによるプログラミング、データの要約
    • プログラミング言語「R」の基本的な使い方
    • 度数分布表、ヒストグラム
    • 代表値:平均値、中央値、最頻値
    • データの広がり:分散、標準偏差
    • 箱ひげ図
  2. 事象と確率変数
    • 確率、確率変数、確率分布の概念
    • 確率分布の例
    • 期待値、分散
    • 相関係数
  3. 推定
    • 推測統計の考え方
    • 点推定と区間推定
    • 平均の区間推定
    • 最尤法
  4. 仮説検定
    • 仮説検定の考え方と手順
    • 平均に対する仮説検定
    • 平均の差の検定
    • 独立性の検定
  5. 単回帰分析
    • 線形単回帰分析とは
    • 最小二乗法
    • 標準誤差
    • 有意性の検定
    • t値とP値
  6. 重回帰分析
    • 重回帰分析とは
    • 最小二乗法
    • 有意性の検定
    • 回帰係数の解釈
    • 決定係数
    • 赤池情報量規準(AIC)
    • 交互作用
    • 質的変数の数量化(ダミー変数)
  7. 主成分分析
    • 教師なし学習とは
    • 主成分分析とは
    • 主成分方向の計算
    • 寄与率
  8. 多次元尺度構成法
    • 多次元尺度構成法とは
    • 多次元尺度構成法の計算法
    • 代表的な距離の計算方法
  9. 判別分析
    • 判別問題とは
    • 線形確率モデルとその問題点
    • ロジスティック回帰
    • 線形判別分析(LDA)
    • ロジスティック回帰と線形判別分析の比較
  10. 時系列分析
    • 時系列分析とは
    • 定常過程
    • 自己相関関数(ACF)
    • ARモデル・MAモデル・ARMAモデル
    • モデルのあてはまりの評価
    • モデルの選択
    • 単位根検定
  11. 実践的総合演習

    講義スケジュール

    ★講義スケジュールはこちら。
    講師からのメッセージ
    • (小池 祐太 准教授)
      データから価値を生み出すには、データの解析結果が真に有益な情報を含むかを判断するスキルが必要です。本講座では、その助けとなるツールを提供する統計学の原理について、基本的なデータ解析手法とともに習得することを目指します。(小池 祐太 准教授)
      小池 祐太 准教授