课程介绍
内容
-
课程大纲
华东师范大学
研究生课程教学大纲(2021版)
课程编码
MBA05511202003
课程类别
专业选修课
课程名称(中文)
高级机器学习方法
课程名称(英文)
Advanced Machine Learning Methods
学时/学分
36学时/2学分
其中实验/
实践、实务课学时
8学时
开课单位
统计学院
适用学科专业
(类别领域)
MBA
先修课程
数据模型与统计
大纲撰写人
李艳
大纲审核人
教学负责人
授课语言
中文
课程网址
无
说明:1、课程编码填写研究生培养系统课程库的编码;
2、课程类别选择下列类别之一:学位公共课(公共必修课、人类思维与学科史论、通识选修课,三选一)、基础课、专业课(必修、选修,二选一)
一、课程简介(中英文)
本课程主要介绍机器学习的基本原理和几种经典算法,包括决策树、集成学习(随机森林、Boosting 、Stacking)和人工神经网络等,并结合案例、通过Python编程实现和应用各类算法。
This course mainly introduces basic principles of machine learning, several classical or advanced algorithms, including decision trees, ensemble learning (Bagging, Random forest, Boosting, Stacking) and artificial neural networks, as well as their implementation and application in real cases through Python programming.
二、课程目标
目标1:通过本课程的学习,学生应从理论和实务两个层面掌握统计学习方法的基本原理和应用,熟悉相关模型的基本思路、步骤和处理技巧,并且具有初步的方法研究创新能力。
目标2:学生应了解数据科学中数据分析相关职业素养,自觉恪守数据真实性底线,能批判性地评价统计学习方法和结果的科学性。
目标3:学生应掌握阅读学术论文等文献资料的基本能力,能通过阅读文献较为准确地掌握统计学习领域的前沿方法。
三、教学内容与安排
第一章 决策树²
学时:8
本章节内容概述:介绍CART算法,包括算法的基本思路、优化方法、分枝和剪枝策略及其应用。本章的实验、实践环节要求:能熟练地使用scikit-learn等Pyhton库准确地实现决策树建模,对模型做评价并应用模型做预测。
第二章 机器学习导论
学时:4
本章节内容概述:介绍机器学习的三要素(模型、学习准则和优化算法)和模型解释方法(作用机制和影响程度)。本章的实验、实践环节要求:能熟练地使用scikit-learn等Pyhton库进行各项数据预处理,并能通过变量重要性、偏依赖图和SHAP values等解释模型。
第三章 模型评价与选择
学时:4
本章节内容概述:介绍模型评价的各项指标(包括统计量和图形),以及模型选择的准则和方法。本章的实验、实践环节要求:能熟练地使用scikit-learn等Pyhton库准确地评价和选择模型,并解读结果。
第四章 神经网络与深度学习²
学时:6
本章节内容概述:介绍神经网络的基本概念和特征,重点是参数学习方法(反向传播算法)、网络优化方法(小批量梯度下降法、学习率调整、梯度估计修正、参数初始化方法和归一化方法等)和正则化方法(L1/L2约束、提前终止、权重衰减、丢弃法和数据增强等)。本章的实验、实践环节要求:能基于Keras等框架,利用实际数据建立神经网络模型,并解读结果。
第五章 集成学习²
学时:10
本章节内容概述:介绍随机森林、XGBoost、LightGBM和Stacking等方法的基本原理及其应用。本章的实验、实践环节要求:能基于实际数据灵活运用各集成学习方法,能基于scikit-learn等Pyhton库实现各集成学习方法,对模型做评价并应用模型做预测。
第六章 案例讨论
学时:4
本章节内容概述:通过案例讨论,综合性地总结梳理机器学习各实践环节。
四、主要教学方法
1.本课程采用教师讲授、案例分析与代码演示等相结合的教学方法。其中,基本原理以讲授为主,基于Python的操作部分以学生学习线上视频与教师线下辅导相结合。
2.通过作业与案例分析,要求学生基于实际数据完成统计建模,并展示、交流与讨论。
五、考核方式与要求
本课程的考核采用考查方式,成绩采用百分制,成绩的评定兼顾平时表现和案例分析。成绩总评包含三个部分:(1)考勤,占10%;(2)课堂讨论,占30%;(3)作业,占20%;(4)小论文,占40%。
六、教材与参考资料
- 教材:
机器学习,周志华,清华大学出版社,2016年。
2. 代表性教学参考书:
1、The Elements of Statistical Learning: Data Mining, Inference, and Prediction (2nd Edition), Trevor Hastie, Robert Tibshirani, Jerome Friedman, Springer,2009。
2、统计学习方法,李航,清华大学出版社,2012。
3、集成学习,周志华著,李楠译,电子工业出版社,2020。
4、神经网络与深度学习,邱锡鹏, 机械工业出版社,2020。
5、Hands-On Machine Learning with Keras & Tensorflow(影印版), Aurélien Géron, 东南大学出版社,2020。
6、Python机器学习(原书第2版),Sebastian Raschka、Vahid Mirjalili著,陈斌 译,机械工业出版社,2019。
7、美团机器学习实践,美团算法团队著,人民邮电出版社,2018。
8、阿里云天池大赛赛题解析——机器学习篇,天池平台著,电子工业出版社,2020。
9、Interpretable Machine Learning: A Guide for Making Black Box Models Explainable, Christoph Molnar著,Lulu Pres,2020.
10、Understanding Machine Learning: From Theory to Algorithms,Shai Shalev-Shwartz and Shai Ben-David著,Cambridge University,2014。
11、Foundations of Machine Learning (second edition),Mehryar Mohri, Afshin Rostamizadeh,Ameet Talwalkar著,The MIT Press,2018。