科目コード | C0-4140 |
---|---|
科目名 | データマイニング入門 |
担当者名 | 深澤 克朗 |
授業の概要 | 近年のIT技術の進展に伴い、大量のデータが蓄積されている。 企業などでは、この大量のデータ(ビッグデータ)を何らかの方法で処理し、経営に役立たせることが急務になっている。 これを行える人材をデータサイエンティストという。本授業では、データを科学的に分析するための数学的及び統計学的基礎と、データ分析方法として頻繁に用いられるいくつかの手法を紹介する。 |
実務経験内容 | |
事前・事後学習の内容 | 特に限定するものではないが、「線形代数」や「統計学」を履修していることが望ましい。 |
到達目標 | ①記述統計学で使われる変数の意味が理解できる。 ②(重)回帰分析での統計量を理解できる。 ③回帰式の妥当性を判定でき、修正する方法を提案できる。 ④主成分分析法のプロセスがわかり、結果の意味が理解できる。 ⑤問題に対して、どのような手法を使うことが適切なのかを提案できる。 |
授業の進め方 | 様々な分析手法を紹介し、数学的背景とExcelやRにて扱う方法を紹介する。 演習は少人数グループにて行う。 |
授業計画 | 【第1回】データマイニングの紹介 【第2回】データマイニングの手法について 【第3回】回帰分析の考え方 【第4回】回帰分析の実例 【第5回】回帰分析演習 【第6回】回帰分析演習・評価 【第7回】重回帰分析の考え方 【第8回】重回帰分析での統計量 【第9回】重回帰分析実例 【第10回】重回帰分析演習・評価 【第11回】主成分分析の考え方 【第12回】主成分分析の手順①数学的手順 【第13回】主成分分析の手順②R言語手順 【第14回】主成分分析演習 【第15回】主成分分析演習・評価 【第16回】因子分析の考え方 【第17回】因子分析実例 【第18回】判別分析の考え方 【第19回】判別分析実例 【第20回】クラスター分析の考え方 【第21回】クラスター分析実例 【第22回】テキストマイニング紹介 【第23回】テキストマイニングの実例 【第24回】ビッグデータについて 【第25回】ビッグデータの実例紹介 【第26回】総合演習①テーマの選定 【第27回】総合演習②データ探索 【第28回】総合演習③データ加工 【第29回】総合演習④データ分析 【第30回】総合演習⑤評価 |
成績評価方法 | 出席30% レポート70% |
テキスト | 特になし |
参考文献 |