教学大纲
内容
-
教学大纲
数据挖掘教学大纲
课程名称:数据挖掘 (Data Mining)
一、课程目的、任务:本课程介绍基本的数据挖掘方法,并结合R语言将方法应用于现实数据。课程旨在使学生掌握经典且应用广泛的知识挖掘方法,并结合实际问题进行分析和解读,更好地满足现实中利用数据进行分类和预测等需求。
二、课程内容:课程由多种经典且应用广泛的数据挖掘方法构成,以实现现实中的分类和预测等目标。
三、教学方式、实践环节的特色:结合大量的现实数据案例进行讲授;从理论和案例中对多种方法进行比较和解读;结合R语言,实现理论方法在现实数据上的应用;每位学生要利用现实数据进行案例分析。
四、教材及参考书目:
教材:T. Hastie, R. Tibshirani, J. Friedman:《The Elements of Statistical Learning》,世界图书出版公司,第2版
参考书目:
1、周志华:《机器学习》,清华大学出版社,2016年版.
2、美团算法团队:《美团机器学习实践》,人民邮电出版社,2018年版.
3、X. Wu, V. Kumar:《The Top Ten Algorithms in Data Mining》,CRC Press, 2009.
4、Ian H. Witten 、 Eibe Frank 、 Mark A. Hall : 《Data Mining: practical machine learning tools and techniques》, Elsevier,2011.
5、J. Han, M. Kamber, J. Pei著,范明、孟小峰译:《数据挖掘概念与技术》,机械工业出版社,2012年版.
6、M. Kantardzic著,王晓海、吴志刚译:《数据挖掘:概念、模型、方法和算法》,清华大学出版社,2013年版.
7、B. Lantz著,李洪成、许金炜、李舰译:《机器学习与R语言》,机械工业出版社,2016年版.
8、黄文、王正林:《数据挖掘:R语言实战》,电子工业出版社,2014年版.
9、L. Torgo著,李洪成、陈道轮、吴立明译:《数据挖掘与R语言》,机械工业出版社,2014年版.
10、Y. Zhao著,陈健、黄琰译:《R语言与数据挖掘最佳实践和经典案例》,机械工业出版社,2015年版.
11、S. Raschka著,陈斌译:《Python机器学习》,机械工业出版社,2018年版(原书第2版).
五、考核方式与评价结构比例:
平时成绩占60%,采用课堂测试、作业、数据分析项目等形式进行;期末小论文,成绩占40%。
六、讲授大纲:
第1章 数据挖掘导论
1.1 为什么需要数据挖掘
1.2 什么是数据挖掘
1.3 挖掘什么样的数据
1.4 挖掘获得怎样的模式
1.5 数据挖掘技术
1.6 数据挖掘主要问题
第2章 数据预处理
2.1 业务理解
2.2 数据划分
2.3 探索性数据分析
2.4 特征构造
2.5 缺失数据处理
2.6 特征选择:过滤法
2.7 数据变换
2.8 离群值处理
2.9 抽样
2.10 特征选择:封装法
第3章 数据挖掘方法
3.1 朴素贝叶斯
3.2 K近邻
3.3 模型评价方法
3.4 决策树
3.5 集成学习
3.6 关联分析
3.7 MARS
3.8 文本挖掘
七、教学时数分配:
章次
第1章
第2章
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
学时
2
4
2
2
2
4
6
2
2
4