統計分析(S) Rを活用した実践的統計・データ分析
講座の趣旨
- 統計学を深く正確に理解するとともに、実務で活用できるような実践力を身に付けることを目指します。
- 統計の各種手法について、数学的背景をふまえて体系的に講義し、実践的な演習を行います。
- 演習ではプログラミング言語「R」を使用します。
到達目標
- 推定、検定、回帰分析、判別分析、主成分分析、多次元尺度構成法、時系列解析などの主要な統計的手法を活用して、データ分析を行うことができる。
- 新しい課題に対してでも、データ活用の設計、分析手法の選択と実行、分析結果の解釈、業務への活用の提案など、一連の業務を適切に行えるようになる。
数学レベル
- 高校までの理系数学と大学1年生レベルの偏微分、積分について、あらかじめある程度知っていることが望ましいです。
カリキュラム
-
Rによるプログラミング、データの要約
- プログラミング言語「R」の基本的な使い方
- 度数分布表、ヒストグラム
- 代表値:平均値、中央値、最頻値
- データの広がり:分散、標準偏差
- 箱ひげ図
-
事象と確率変数
- 確率、確率変数、確率分布の概念
- 確率分布の例
- 期待値、分散
- 相関係数
-
推定
- 推測統計の考え方
- 点推定と区間推定
- 平均の区間推定
- 最尤法
-
仮説検定
- 仮説検定の考え方と手順
- 平均に対する仮説検定
- 平均の差の検定
- 独立性の検定
-
単回帰分析
- 線形単回帰分析とは
- 最小二乗法
- 標準誤差
- 有意性の検定
- t値とP値
-
重回帰分析
- 重回帰分析とは
- 最小二乗法
- 有意性の検定
- 回帰係数の解釈
- 決定係数
- 赤池情報量規準(AIC)
- 交互作用
- 質的変数の数量化(ダミー変数)
-
主成分分析
- 教師なし学習とは
- 主成分分析とは
- 主成分方向の計算
- 寄与率
-
多次元尺度構成法
- 多次元尺度構成法とは
- 多次元尺度構成法の計算法
- 代表的な距離の計算方法
-
判別分析
- 判別問題とは
- 線形確率モデルとその問題点
- ロジスティック回帰
- 線形判別分析(LDA)
- ロジスティック回帰と線形判別分析の比較
-
時系列分析
- 時系列分析とは
- 定常過程
- 自己相関関数(ACF)
- ARモデル・MAモデル・ARMAモデル
- モデルのあてはまりの評価
- モデルの選択
- 単位根検定
-
実践的総合演習