课程大纲
内容
-
课程大纲
“统计建模”课程教学大纲
课程名称(中文):统计建模
课程名称(英文):Statistical Learning
线上教学平台:大夏学堂
线下课程时间地点:周三上午8:55-11:25,中北,共18周。
任课教师:李艳 副教授,yli@stat.ecnu.edu.cn
一、课程简介
本课程主要讲述统计建模(含数据处理、统计学习等)的基本理论和方法。
预备课程:数学分析、高等代数、概率论、数理统计、回归分析。
二、课程目标
1、掌握基本的统计建模的理论和方法。
2、学会利用Python或R语言实现相应的方法。
三、教学内容
1、统计建模导论
要点:掌握统计建模的目标和思路,包括各种模型评价指标和优化方法。
2、数据预处理
要点:了解数据预处理与建模的关系;掌握基本的预处理方法,包括数据划分、离群值识别和处理、缺失值处理、采样、特征工程等;能基于实际数据,进行数据预处理。
3、决策树
要点:掌握决策树方法的基本思路,了解各种不同的分枝和剪枝策略及其理论;能基于实际数据,采用CART,C4.5等经典的决策树算法进行建模分析。
4、模型评价与选择
要点:掌握模型评价的各项指标,能正确选择指标评价模型并解读结果;掌握模型选择的主要指标和思想。
5、集成学习
要点:掌握Bagging,随机森林,Adaboost,XGBoost,LightGBM,Stacking等方法的基本思路及其理论;掌握梯度下降优化方法;能基于实际数据,采用各集成学习方法进行建模分析。
6、支持向量机
要点:掌握支持向量机的基本思路及其理论,重点应掌握优化目标、支持向量、对偶算法、核方法等;能基于实际数据,采用支持向量机方法进行建模分析。
7、K近邻
要点:掌握K近邻方法的基本思路及其理论;能基于实际数据,采用K近邻方法进行建模分析。
8、关联分析
要点:掌握Apriori算法和Eclat算法的基本思路及其理论;能基于实际数据,实现关联分析。
9、神经网络与深度学习
要点:掌握神经网络方法的基本思路;掌握网络结构和参数估计的理论和方法,了解误差逆传播算法;掌握CNN、RNN等深度学习理论和方法;能基于实际数据,采用神经网络与深度学习方法进行建模分析。
10、案例分析与交流
要点:主要由同学交流展示建模案例分析成果。
课程将理论结合实际,所有讲述的方法都以Python或R语言实现,通过具体的案例来展示。
教学时数分配
每周3学时,教学周:1-18周。
章次
1
2
3
4
5
6
7
8
9
10
机动
共计
学时
3
3
6
3
12
3
3
3
12
3
3
54
四、教材和参考书目
教材:
任课老师组织课件。主要课程内容来自于以下两本书:
1、机器学习,周志华,清华大学出版社,2016。
2、The Elements of Statistical Learning: Data Mining, Inference, and Prediction (2nd Edition), Trevor Hastie, Robert Tibshirani, Jerome Friedman, Springer,2009。
参考书:
1、Understanding Machine Learning: From Theory to Algorithms,Shai Shalev-Shwartz and Shai Ben-David,Cambridge University,2014。
2、Foundations of Machine Learning (second edition),Mehryar Mohri, Afshin Rostamizadeh,Ameet Talwalkar,The MIT Press,2018。
3、统计学习方法,李航,清华大学出版社,2012。
4、集成学习,周志华著,李楠译,电子工业出版社,2020。
5、深度学习,Ian Goodfellow、Yoshua Bengio、Aaron Courville著,赵申剑等译,人民邮电出版社,2017。
6、神经网络与深度学习,邱锡鹏, 机械工业出版社,2020。
7、Hands-On Machine Learning with Keras & Tensorflow(影印版), Aurélien Géron, 东南大学出版社,2020。
8、Python机器学习(原书第2版),Sebastian Raschka、Vahid Mirjalili著,陈斌 译,机械工业出版社,2019.
9、机器学习与R语言(原书第2版), Brett Lantz著,李洪成,许金炜,李舰译 机械工业出版社,2017。
10、美团机器学习实践,美团算法团队 著,人民邮电出版社,2018。
五、考核办法与评价结构比例
总分100分,包含:考勤10%,课堂小测验15%,作业25%,数据分析项目15%,期末小论文35%。