データサイエンス入門

演習 I(2020年開講)3年生配当 必修科目

西南学院大学 経済学部 担当 市東亘

シラバス

  1. データサイエンスとは
  2. 講義内容
  3. 受講上の注意
  4. 評価方法
  5. 受講者選考方法
  6. 受講生へのメッセージ

SlideShareに公開されている講義ノートはDownloadボタンからダウンロードできます.

リソース

春休みの宿題

タイピング

授業内の限られた時間で円滑なプログラミング作業を行うには,素早いタイピング技術が必須です.春休み中にタッチタイピング(ブラインドタッチ)を習得しておいてください.初回授業でチェックします.

Rの予習(班活動)

講義の発表割り当て

Rによる大規模データ操作

ここでは春休みに学んだRの基礎テクニックを応用して,Excelで扱うには難しい大量のデータを,Rで書いたプログラムから操作・処理する方法を学びます.ただしここでは,ビッグデータと呼ばれるテラバイト級のデータの扱い方は学びません.

教師あり学習アルゴリズム

k-近傍法

ここでは最近傍法の1つk-近傍法を使ったデータ分類アルゴリズムを学びます.

ナイーブ・ベイズ

スパムフィルタなどで活躍する単純ベイズ法を使った分類アルゴリズムを学びます.講義までに講義ノートの練習問題1と2を解いてきてください.

決定木と分類ルール

決定木と分類ルールと呼ばれる学習アルゴリズムを使った分類アルゴリズムを学びます.

回帰法による数値予測

ニューラルネットワークとサポートベクトルマシン

教師なし学習アルゴリズム

メタ学習アルゴリズム