演習 I(2020年--現在 開講)3年生配当 必修科目
西南学院大学 経済学部 担当 市東亘
SlideShareに公開されている講義ノートはDownloadボタンからダウンロードできますがユーザ登録が必要です(無料).
授業内の限られた時間で円滑なプログラミング作業を行うには,素早いタイピング技術が必須です.春休み中にタッチタイピング(ブラインドタッチ)を習得しておいてください.初回授業でチェックします.
前半講義ではR講義ノートを担当班が解説する形で進みます.担当箇所は下記発表順を参照してください.発表班は少なくとも「チェックリスト」に記載の内容と,練習問題,実習,宿題は全て解説してください.もちろん,講義ノートに記載されていること以上に調べて解説してもらって結構です.講義は進めるだけ進みますので,常に2つ先くらいの班まで発表準備しておいてください.
Rの学習を終えたら機械学習の学習に入ります.機械学習は私が講義し,各単元の終わりに班毎にデータ分析の結果を報告してもらいます.
ここでは春休みに学んだRの基礎テクニックを応用して,Excelで扱うには難しい大量のデータを,Rで書いたプログラムから操作・処理する方法を学びます.ただしここでは,ビッグデータと呼ばれるテラバイト級のデータの扱い方は学びません.
これ以降はいよいよ機械学習を学び始めます.どのような分析をしようとも分析の前には必ずデータの前処理(整形やクリーニング)が必要になります.その際にはプログラミング・スキルが要求されるので事につけRの講義ノートを復習し,更なる習得に努めてください.また,夏休みや冬休みにはプログラミングの書籍を2冊くらい読むように心がけてください.学ぶ言語に関わらずプログラミングのスキルが向上します.
ここでは最近傍法の1つk-近傍法を使ったデータ分類アルゴリズムを学びます.
スパムフィルタなどで活躍する単純ベイズ法を使った分類アルゴリズムを学びます.講義までに講義ノートの練習問題1と2を解いてきてください.
決定木と分類ルールと呼ばれる学習アルゴリズムを使った分類アルゴリズムを学びます.