课程介绍
内容
-
课程介绍
《人类思维与学科史论:统计学》课程介绍
统计学是发源于多个学科的一门方法论学科,是认识世界数量特征的重要工具。统计学围绕数据的收集、整理、分析和解释,在理论上提供关于不确定性度量的科学基础,在应用上以解决实际问题为目标、探索最优的决策方案。
统计思维是从数据中提取信息、论证结论可靠性等过程中表现出来的一种思维模式。本课程以统计学如何与各学科领域相伴而行、相互推动为主线,介绍统计学在天文学、认知科学、医学、遗传学和人工智能等科学领域之中得以发展的重大历史事件,培养学生具有逻辑性、批判性、创造性的统计思维。
统计学是方法学,学习统计学可以让人开窍,懂得统计学可以使人增加悟性,运用统计学更能体现人的理性和智慧。人类思维与学科史论的统计学模块对正在构建知识体系的大学生来讲无疑是有极大帮助的一门课程。
一、基本信息
课程名称:人类思维与学科史论:统计学
英文名称:Human Thinking and the History of Academic Disciplines: Statistics
学 时:18
学 分:1
开课单位:经济与管理学部 统计学院
授课对象:全校非统计学专业本科生
教学团队:
丁帮俊,华东师范大学统计学院教授。2002年获复旦大学理学博士学位,曾在香港大学和美国哈佛大学访学,研究方向为不完全数据统计分析、应用统计。主持12项省部级以上科研项目,在国内外核心期刊发表论文40多篇。多次荣获华东师范大学优秀任课教师奖,曾获得上海市教学成果二等奖。
李艳,华东师范大学统计学院副教授。2011年获华东师范大学理学博士学位,曾在美国佐治亚理工学院和香港科技大学访学。研究方向为应用统计、统计质量管理、因果推断。主持完成国家自然科学基金2项,曾获得3项省部级科研奖项,以及上海市教育发展基金会申万宏源奖教金和上海市教学成果二等奖。
二、教学目标
总体目标:
以思维习惯养成和思维能力提升为核心目标。一方面,沿着统计学思想和方法的发展脉络,培养学生具备像统计学家一样探索、思考和分析问题的思维习惯。另一方面,从基本而形象的数据思维入手,培养学生逐步构建具有逻辑性、批判性、创造性和形象的统计思维,从而提升学生的思维能力。
具体目标:
1.训练学生的逻辑思维和形象思维。通过对数据素养多个维度的引介和讨论,培养学生以数据思维为核心的逻辑思维;通过统计学的科学性、艺术性和工程性探讨,提高学生的形象思维能力,以及通过数据分析解决实际问题的能力。
2.训练学生的创造性思维。通过统计学方法的发展历史,特别是与其他学科互为促进的发展过程,加强学生的问题意识和创新意识,培养创造性思维。
3.训练学生的批判性思维。通过统计学家的争论和创新,逐步培养学生的批判性思维,提高学生的创新能力。
三、教学内容
本课程教学内容共六讲,分别为:数据与数据思维、正态分布的发现、将信息融入统计推断、怎样对假设进行检验、关联与因果分析、统计学的艺术思维与工程思维。以统计学发展时间为线索,精选了这六个方面的重大历史事件,向学生展示著名统计学家的历史地位、学术思想和主要贡献,阐发不同阶段统计学思想产生的主客观条件及统计学的发展趋势。
表1-《人类思维与学科史论:统计学》课程教学内容
讲授主题
思维训练要点
主要内容
第一章
数据与数据思维
数据思维
逻辑思维
批判性思维
1.1 认识数据
1.2 从复杂到简单的思维
1.3 从随机到确定的思维
1.4 从混沌到智慧的思维
第二章
正态分布的发现
创造性思维
2.1 数据分布常常具有对称性特征
2.2 简单的0-1分布问题难倒了统计学家
2.3 二项分布概率的正态分布逼近导致了统计学大发展
2.4 高斯对误差分布的研究
2.5 正态分布取得统计学的中心地位与拉普拉斯的重要贡献
第三章
将信息融入统计推断
创造性思维
3.1 人们的实践经验与先验的概念
3.2 由先验推出后验的Bayes方法
3.3 关于Bayes假设的争论
3.4 Bayes统计学
第四章
怎样对假设进行检验?
创造性思维
批判性思维
4.1 怎样判断一种药物能不能治疗新冠病毒?
4.2 统计检验是如何进行的?
4.3 Pearson与Fisher的争论:大统计学家Pearson也会犯错
4.4 Neyman-Pearson定理对现代统计学的影响
4.5多元统计分析学科的开拓者许宝禄
第五章
关联与因果分析
创造性思维
批判性思维
5.1 从相关性到回归模型
5.2 因果推断方法的发展
第六章
统计学的艺术思维与工程思维
形象思维
创造性思维
6.1 统计学的科学性与艺术性
6.2 统计学的工程性
第一章概览几种基本的数据思维。数据思维是关于数据科学的思维,主要有下面几种形式:(1)从复杂到简单的思维,介绍数据分析师常用的八种分析方法和分析思维,即对比分析法、分层分析法、相关分析法、同期群分析法、漏斗分析法、逻辑树分析法、核心指标拆解法和小样本灰度测试寻找最优方案 AB Test法。这些方法和思维有助于帮助我们将复杂问题简单化、简单问题效率化。(2)从随机到确定的思维,引入四种观点作为课堂讨论:(i)认为世界上一切都是随机的。例如塔勒布的《随机漫步的傻瓜》,让我们认识了众多的事件都具有随机性,而不是我们以为的那么有迹可循。(ii)随机中蕴藏着秩序。例如,巴拉巴西的《爆发》描述其观点与塔勒布相左,认为事件百分之九十多都是可以预测的,随机事件的背后蕴藏着深层次的秩序。一滴墨水滴在水里,墨迹运动是随机的,但是墨迹扩散并最终消失在水中的时间是确定的。人的行动轨迹也是随机的,流感的爆发却可以准确地预测。(iii)决定论与非决定论。世界是随机的还是确定的?哲学界存在决定论与非决定论两种对立的观点。决定论认为事物具有因果联系性、规律性、必然性,而非决定论恰恰相反,认为事物的运动不受因果关系的制约,没有任何秩序。(iv)随机性和确定性都有前提。随机性和确定性应该都是有前提条件的。在一定的尺度上,有一种规律起主导作用。(3)从混沌到智慧的思维,既联系爱因斯坦等科学家的世界观,又结合科学和生活中的诸多事例,探讨统计如何智慧地改变世界、思想和生活。在教学过程中,我们与学生讨论上述数据思维的案例,并归纳出数据思维对于解决实际问题的科学性,提高学生解决问题的能力。
第二章是关于正态分布的发现。正态分布来源于天文学中天体位置的观测误差。我们将介绍正态分布如何起源于二项分布、中心极限定理的发现、正态分布密度函数的推演、正态分布在误差领域的应用,以及对这一过程产生巨大影响的统计学家(狄莫弗、斯特林、牛顿、拉普拉斯、内曼等)。从这些历史事件之中,我们可以看到科学研究中开创性观点提出之不易。有时某一观点所需材料都已具备,甚至接近了这一观点的边缘,但由于没有往这个方向着眼,这创新观点差一步就出不来,由此阐明创造性思维的要义。在这段历史中,我们还需要关注正态分布理论如何被应用到现实生产生活和各学科的研究之中,从而走进统计学核心位置。这其中有一位重要的人物,即凯特勒。他自1831年起参与主持新建比利时统计总局的工作,开始从事有关人口问题的统计学研究。凯特勒发现,以往被人们认为杂乱无章的、偶然性占统治地位的社会现象,如同自然现象一样也具有一定的规律性。凯特勒搜集了大量关于人体生理测量的数据,如体重、身高与胸围等,并使用概率统计方法来对数据进行数据分析。但是当时的统计分析方法遭到了社会学家的质疑,社会学家们的反对意见主要在于:社会问题与科学实验不同,其数据一般由观察得到,无法控制且经常不了解其异质因素,这样数据的同质性连带其分析结果往往就有了问题,于是社会统计工作者就面临一个如何判断数据同质性的问题。凯特勒大胆地提出了一个使用正态曲线拟合数据的方法,并广泛的使用正态分布去拟合各种类型的数据。由此,凯特勒为正态分布的应用拓展了广阔的舞台。正态分布如同一把屠龙刀,在凯特勒的带领下,学者们挥舞着这把宝刀在各个领域披荆斩棘,攻陷了人口、领土、政治、农业、工业、商业、道德等社会领域,并进一步攻占天文学、数学、物理学、生物学、社会统计学及气象学等自然科学领域。在教学过程中,通过讨论上述最大历史事件,让学生认识到科学研究创造性思维的重要性。
第三章是如何将信息融入统计推断的方法。人们如何将经验或已知的信息融入认知和推断之中?这是认知科学关注的一个问题。贝叶斯统计正是量化了这一认知的经典方法。贝叶斯方法并不难,我们通过大量来自生活中的例子说明贝叶斯方法,看看这种方法如何将人们的经验与抽样数据相结合并做出统计决策的。贝叶斯决策理论是主观贝叶斯派归纳理论的重要组成部分。贝叶斯决策就是在不完全信息下,首先对部分未知的状态用主观概率估计,其次利用贝叶斯公式对发生概率进行修正,最后再利用后验期望和修正概率做出最优决策。例如,经典著作《人工智能:现代方法》的作者之一 Peter Norvig 曾经写过一篇介绍如何写一个拼写检查/纠正器的文章,里面用到的就是贝叶斯方法。他阐述的问题是当看到用户输入了一个不在字典中的单词时,我们需要去猜测用户真正想输入的单词是什么。显然,我们的猜测未必是唯一的,不妨将多个猜测记为 h1,h2…,将用户实际输入的单词记为D,运用贝叶斯公式可获得后验概率值P(h1|D) ,P(h2|D) … 。我们选取使得后验概率值达到最大的单词作为最终的推断结果,在一定的条件下这就是最优的方法。本章中,我们着重于介绍贝叶斯对统计推理的主要贡献——使用“逆概率”这个概念并把它作为一种普遍的推理方法提出来,这种解决问题的思路别具一格,是创造性思维案例的典范。同时,结合统计学家贝叶斯的生平,以及“频率学派”和“贝叶斯学派”的争论,展现批判性思维的价值。
第四章是关于假设检验的统计方法。通过药物抗冠状病毒感染的例子引入假设检验方法。介绍假设检验方法从个案的处理方式到基于普适性原则和标准的理论发展过程,从卡尔·皮尔逊和费歇尔的争论到奈曼和爱根·皮尔逊、许宝禄的持续跟进研究。其中一个重要案例是统计学家卡尔·皮尔逊研究关于带参数分类数据检验问题时弄错了自由度,这个错误最先被费希尔发现并于1924年给出了正确的结果。为此事两人进行了长时间的争论,这成为20世纪初期统计史上的一个重大事件。这也是卡尔·皮尔逊众多工作中一个比较最大的失误。通过这一章的学习,让学生认识到说明“批判性思维”在科学研究中的重要性,同时展现了创造性思维和批判性思维的相互交织、互为促进。
第五章是关于关联与因果分析的方法。本章从两个角度呈现关联分析与因果分析方法的发展历史,通过统计学家“成”与“败”的案例探讨,训练学生思维。第一个角度:高尔顿成功提出回归模型和相关性分析方法。从遗传学中父代与子代遗传因果关系的问题出发,统计学家高尔顿基于一系列遗传学实证数据发现了“向均值回归”的遗传学规律,进而提出了回归模型和相关性分析方法;他巧妙地设计了“高尔顿板”,用以直观展示他的研究理论。通过这一段历史的呈现,使学生了解统计学中一些重要方法的由来,启发学生如何构建创造性思维。第二个角度:高尔顿错失因果关系真相。由于被有缺陷的因果模型所误导,高尔顿对遗传学中因果关系的探索失败了,更为可惜的是,这一次失败在长达数十年的时间里抑制了统计学在因果推断方面的发展。通过这段耐人寻味的历史事件,向学生展现创造性思维和批判性思维过程中可能经历的曲折,从而加强学生的思维训练。
第六章是关于统计学的艺术思维和工程思维。通过介绍融入人工智能的统计学方法发展历程和科学家们的探究经历,特别是神经网络模型几起几落的发展过程,以及以Geoffrey Hinton等为代表的科学家如何推动人工神经网络方法及其应用,为学生展现提升形象思维和创造性思维的方法。依循“提出问题-分析问题-解决问题-未来应用”的流程,引导学生理解和应用“问题转化-收集数据-预处理数据-分析数据-解释数据-问题解决”的统计学工程。通过剖析这一工程中每一个步骤可能面临的诸多困难及其解决思路,引导学生拓展思路,掌握训练和提升创造性思维的方法。
四、教学方法和考核方式
教学方法:
以引介和培养统计思维为核心教学理念,以训练学生的形象思维、逻辑思维、创造性思维和批判性思维能力为路径,采用讲授为主、课堂讨论和课后阅读制定文献资料为辅的教学形式开展教学活动。对精心挑选的统计学发展史上的典型案例进行分析时,采用探究式教学方式,研判统计学家所处的历史环境条件、学术研究、学术贡献等,并以问题为导向提炼案例中的重点、难点、热点问题,供学生课后讨论参考。
考核方式:
表2-《人类思维与学科史论:统计学》考核方式
平时成绩
期末成绩
考核方式
出勤:
根据学生在六次讨论课上的出勤情况给分,出勤少一次扣10分。
课堂报告:
根据报告情况和提交报告质量给分。
期末小论文
针对某个统计问题撰写一篇不少于2000字小论文,要求有数据分析过程。能够体现统计思维的特点。
总成绩占比
20%
40%
40%
五、主要参考阅读材料
钱旭红.改变思维[M].上海:上海文艺出版社,2020.
钱旭红.大学思维[M].上海:华东师大出版社,2020.
陈希儒.数理统计学简史[M].长沙:湖南教育出版社,2002.
孟生旺,袁卫.大数据时代的统计教育[J].统计研究,2015(4):3-7.
刘乐平,袁卫.现代贝叶斯分析与现代统计推断[J].经济理论与经济管理,2004(6):64-69.
袁卫.我国统计高等教育的回顾与前瞻[J].统计研究,2001:45-50.
刘强.大数据时代的统计学思维[M].北京:中国水利出版社,2021.
杨轶莘.大数据时代下的统计学[M].北京:电子工业出版社,2019.
李舰,海恩.统计之美:人工智能时代的科学思维[M].北京:电子工业出版社,2019.
朱迪亚·铂尔,达纳·麦肯齐.为什么:关于因果关系的新科学[M].江生,于华,译.北京:中信出版社,2019.