数据科学专业概率论教学研究

数据科学专业概率论教学研究

[摘要]基于医科院校的数据科学与大数据技术专业开设“概率论与数理统计”课程进行教研。从课程结构、课程内容和课程目标三方面对该课程进行分析和研究。课程结构主要提出开设“概率论与数理统计”的实验课,使得学生更好地掌握所学知识点;课程内容通过案例分析法和大量融入数学建模的思想,使学生提高对课程的兴趣;锻炼学生解决实际问题的能力。教学实践证明教学内容和方向符合医学院校“大数据”人才的培养方式。

[关键词]概率论与数理统计;大数据技术;医科院校;教学研究

一、研究背景

随着科学技术的发展和社会现代化的推进,社会对大数据科学的研究与应用型人才的需求与日俱增。数据科学与大数据技术专业是近年来国家针对“大数据”时代背景新增的专业。据教育部统计共283所大学获批数据科学与大数据技术专业[1]。本文针对匹配新专业所开设的“概率论与数理统计”课程展开研究和讨论。“概率论与数理统计”课程在医学院校开设了很多年,针对医科院校的同学,这门课程存在较多的问题。医学院校的高等数学和线性代数的课时有限,讲授内容较少,但是“概率论与数理统计”课程对高等数学和线性代数的基础要求较高,所以学生没有较好的基础的话,再学习“概率论与数理统计”课程会显吃力,导致学生对本课程的学习兴趣不浓;并且“概率论与数理统计”是研究随机现象的规律,这种随机性思维,加上统计学里面的参数估计、假设检验、方差分析和回归分析等内容,使得该课程抽象性较强,学生学习起来有一定的难度。由于同学们主动性差,对“概率论与数理统计”课程的教学效果有很大的影响。教师在讲授概率论与数理统计时重理论推导,轻应用实践,把大量时间用于理论和公式推导上,没有针对数学思想和解决实际问题的能力进行强化,学生学完不会用。面对实际的数据,不知道如何分析,即使利用统计软件分析出结果也不能对结果做出合理的解释[2]。针对“概率论与数理统计”课程存在的问题,从课程结构、课程内容和课程目标三个方面进行分析。

二、“概率论与数理统计”课程结构

“概率论与数理统计”是数据科学与大数据技术专业的基础课程,有概率论和数理统计两部分。概率论是数理统计的理论基础,数理统计是概率论的应用,因此“概率论与数理统计”既有坚实的理论基础,又有广泛的应用[3]。针对课程的特点,把课程按1∶4的课时比例分成实验课时和理论课时。学生在理论课上学习完理论知识后,在实验课上利用具体数据对知识进行实验验证,并且对实验结果教师需要进行详细解释,使学生更好地掌握知识点。针对理论课时的教学,对于易懂的内容,采用学生自学并讨论,最后挑选学生以讲授的方式讲解。这样的训练既能让学生对知识点理解透彻又可以培养学生的自学能力。这种授课方式可充分调动学生的学习积极性,活跃课堂气氛,并且学生可以很好地掌握这部分内容。对于难懂的内容,需要老师进行详解,并且针对不好理解的内容教师尽量举例说明,使得学生更容易理解。针对实验课时的教学,通过具体的数据让学生对数理统计部分的知识点进行分析理解。实验部分主要是利用统计软件R语言进行实验。R是一款开源的软件,它涵盖了多种行业数据分析中的方法,并且可以跨平台胜任复杂的数据分析、绘图[4]。在实验课环节,首先让大家熟悉R软件,并对R语言的基本语法讲解,然后针对参数估计、假设检验、方差分析和回归分析分别编程,并对最后的结果做合理的解释。这样学生既可以很好地理解数理统计的原理又可以熟悉统计软件。

三、“概率论与数理统计”内容

在高校中很多学生不能理解学习“概率论与数理统计”课程的实质意义,所以学生学习课程只是为了应付期末考试。由于学生对课程兴趣不浓,在教学过程中,利用案例分析法提高学生的学习兴趣。例如在讲标准正态分布的临界值时,考生成绩X近似服从正态分布N(500,1002),本科生录取率为42.8%,问该省的本科生录取分数线应该划定在多少分以上?学生都参加过高考,他们对本科线到底怎么划出来的比较好奇,通过利用概率论的知识讲解,学生明白概率论与数理统计的知识可以解决我们身边的事情。教师讲授课程时,对于一些复杂的定理、推论和公式等的推导,可以利用稍简单的例子或者图表形式进行解释。这样可以帮助学生理解所学知识点,从而提高学生的学习兴趣。数学源于生活,高于生活。很多生活的实际问题可以通过数学来解决,把数学建模的思想融合到“概率论与数理统计课程”中也是恰到好处。教师需要精巧的设计问题,使学生通过引导建立合理的数学模型,从而培养学生的建模思维方式。对于数据科学与大数据技术专业的同学,数学建模思维方式是重要的一种思考问题的方式。通过这种方式可以引导学生解决课程中的问题,更好地改善“概率路与数理统计”的教学效果。

四、“概率论与数理统计”课程目标

数据科学与大数据技术专业是统计学、数学和计算机三个专业交叉融合形成的学科[2]。重点培养具有三方面素质的人才:一是理论方面,主要是对数据科学中模型的理解和运用;二是实践方面,主要是处理实际数据的能力;三是应用方面,主要是利用大数据技术解决具体行业应用问题的能力[1]。根据人才培养目标,学生的培养方向是具有实操能力较强的人才。“概率论与数理统计”是一门结合理论和应用的课程,作为数据科学与大数据技术专业的基础课程,增强学生解决实际问题的能力。对于医学院校的数据科学与大数据技术专业,主要培养处理医疗问题的大数据人才,在本课程中利用真实的医疗数据让学生利用已学过的知识进行分析处理,最后对结果进行解释说明。通过这样的锻炼,可以使学生对“概率论与数理统计”的知识点更好地掌握,并且对自己未来的定位更明晰。

五、结语

在快速发展的信息时代,培养数据科学与大数据技术专业的人才可以满足社会需求,本文是在大数据科学的研究与应用型人才的需求下对“概率论与数理统计”课程定位以及对该课程的教学内容和课程设置进行详尽的探讨。通过对我校数据科学与大数据技术专业进行教学实践,取得了良好的教学效果,为数据科学与大数据技术专业“概率论与数理统计”课程开设打下了坚实的基础。

作者:谢桃枫 曹莉单位:内蒙古医科大学计算机信息学院