教学大纲
内容
-
教学大纲
华东师范大学专业学位研究生课程大纲
▇课程名称: 统计学习I
▇英文名称: Statistical Learning I
▇课时学分: 36课时,0学分
▇适用专业: 应用统计硕士
▇先修课程: 应用回归分析,实用多元分析,统计计算与软件
▇课程简介: 本课程针对现实中样本量大、变量维度高、定性与定量数据混合等特征的数据集,介绍基本的统计学习方法。涵盖了各种方法的基本原理、算法实现、性能评价及其R语言实现。
▇教学目标:
(一)教学目的:通过本课程的学习,使学生从理论和实务两个层面掌握统计学习方法的基本理论和应用,熟悉相关模型的基本思路、步骤和环节,并且具有初步的方法研究创新能力。
(二)能力目标:通过本课程的学习,学生能够熟练掌握常用的统计学习方法,熟悉相关的模型特征、应用条件、建模方法、预报方法及软件实现,并且能够灵活运用相关知识解决实际问题(特别是大数据分析问题)。
▇教学方式: 结合大量的现实数据案例进行讲授;从理论和案例中对多种方法进行比较和解读;结合R语言,实现理论方法在现实数据上的应用;每位学生要利用现实数据进行案例分析。
▇考核方式:平时成绩占50%,采用作业、数据分析项目等形式进行;期末小论文,成绩占50%。
▇教材及参考文献:
1、T. Hastie, R. Tibshirani, J. Friedman:《The Elements of Statistical Learning》,世界图书出版公司,第2版。
2、周志华:《机器学习》,清华大学出版社,2016年版。
3、美团算法团队:《美团机器学习实践》,人民邮电出版社,2018。
4、Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani:《An Introduction to Statistical Learning with Applications in R》, Springer, 2013。
5、Ian H. Witten 、 Eibe Frank 、 Mark A. Hall : 《Data Mining: practical machine learning tools and techniques》, Elsevier,2011.
6、J. Han, M. Kamber, J. Pei著,范明、孟小峰译:《数据挖掘概念与技术》,机械工业出版社,2012年版。
7、X. Wu, V. Kumar:《The Top Ten Algorithms in Data Mining》,CRC Press, 2009.
8、M. Kantardzic著,王晓海、吴志刚译:《数据挖掘:概念、模型、方法和算法》,清华大学出版社,2013年版。
9、黄文、王正林:《数据挖掘:R语言实战》,电子工业出版社,2014年版。
10、李航:《统计学习方法》,清华大学出版社,2012年版。
▇任课教师: 李艳
▇主要章节内容:
第1章 数据处理方法(3课时)
1.1 探索性数据分析
1.2 特征工程
第2章 分类与预测方法(28课时)
2.1 朴素贝叶斯
2.2 K近邻
2.3 模型评价方法
2.4 决策树
2.5 集成学习
2.6 支持向量机
2.7 神经网络
2.8 关联分析
第3章 案例分析(5课时)
3.1 案例导读
3.2 案例分析与课堂展示
▇大纲撰写人:李艳