课程介绍
内容
-
课程大纲
华东师范大学专业学位研究生课程大纲
▇课程名称: 数据处理与可视化
▇英文名称:Data Manipulation and Visualization
▇课时学分: 36课时(含考试2课时),2学分
▇适用专业: 应用统计硕士
▇课程简介: 大数据对数据挖掘提出了更高的要求,获取高质量的数据及数据的可视化展示成为数据科学中最为重要两项任务。R和python已经成为数据科学中二大最为主要的数据处理、建模与开发语言,本课程将主要使用R语言完成教学的各个环节。《数据处理与可视化》主要介绍数据的读写、数据的分组、分拆、合并、汇总,基于数据库数据的操作,数据可视化要素,静态与动态数据可视化软件包与应用,数据分析可视化产品的开发等。
▇教学目标:
(一) 教学目的: 通过本课程的学习,使学生掌握R语言进行数据处理的主要流程:数据清洗与可视化,各环节数据处理的技巧和可视化技能。本课程将主要结合R进行教学,并简单介绍python中的数据可视化工具。
(二) 能力目标: 通过本课程的学习,使学生能够熟练使用R语言进行数据的基本处理和可视化工作,熟练掌握数据的分组、分拆、合并、汇总、报表等各种R命令及与数据库相关数据处理技巧,熟练地运用静态与动态可视化技术进行数据信息的挖掘与分析结果的展示。
▇教学方式: 本课程采用教师讲授、案例分析、代码演示与上机操作等方式相结合的方法。R语言以自学与辅导相结合,数据处理与可视化以讲授为主,并要求学生完成一定的实际数据分析。
▇考核方式: 本课程的考核采用考查方式,成绩采用百分制,成绩的评定兼顾平时表现和案例分析。成绩总评包含四个部分:(1)课堂出勤请况,占10%;(2)作业,占20%;(3)课堂小测验,占40%;(4)案例分析,占30%。
▇教材及参考文献:
1.教材:
吴翌琳, 房祥忠: 大数据探索性分析, 中国人民大学出版社, 2016.
2.参考文献:
[1] Winston Chang著, 肖楠, 邓一硕, 魏太云译, R数据可视化手册, O’Reilly, 2013.
[2] Hadley Wickham, 殷腾飞译, ggplot2: Elegant Graphics for Data Analysis, Springer, 2009.
[3] Jared P. Lander, R for Everyone: Advanced Analytics and Graphics. New York:Addison-Wesley, 2014.
[4] Deepayan Sarkar, Lattice: Multivariate Data Visualization with R, Springer, 2008.
[5] R.I. Kabacoff著,高涛,肖南, 陈钢译, R语言实战, 人民邮电出版社, 2013.
[6] Alexandre Devert, Matplotlib Cooking Book, Packt, 2014.
[7] Gopi Subramanian著, 方延风, 刘丹译, Python数据科学指南, Packt, 2015.
▇主要章节内容:
第一章 数据预处理
1.0 数据的计量尺度
1.1 数据集成
1.2 数据清理
1.3 数据变换
1.4 数据归约
第二章 探索性数据分析方法
2.1 多维数据的可视化技术
2.2 投影寻踪
2.3 独立成分分析
2.4 奇异值分解
2.5 定性数据的可视化技术
第三章 可视化基础
3.1 可视化导论
3.2 ggplot2绘图系统
3.3 交互式绘图
3.4 python中可视化实现
▇大纲撰写人:李艳