统计学分析数据范例6篇

统计学分析数据

统计学分析数据范文1

关键词:数据挖掘;统计学;比较

中图分类号:TP311.131文献标识码:A文章编号:1007-9599 (2010) 06-0000-01

Comparison of Data Mining and Statistical Analysis

Kong Pengxiang

(Laiwu Iron&Steel Group Co, Ltd.,Training Centre,Laiwu271104,China)

Abstract:Data mining from statistical analysis,but different from the statistical analysis.Data mining is not intended to replace the traditional statistical analysis techniques,on the contrary,statistical analysis of data mining is an expansion and extension.

Keywords:Data mining;Statistical analysis;Comparison

随着科学技术的发展,利用数据库技术来存储管理数据,利用机器学习的方法来分析数据,从而挖掘出大量的隐藏在数据背后的知识。这种思想的结合形成了现在深受人们关注的非常热门的研究领域:数据库中的知识发现――KDD(Knowledge Discovery in Databases),其中,数据挖掘技术便是KDD中的一个最为关键的环节。

一、数据挖掘简介

(一)数据挖掘的含义和功能

数据挖掘―DM(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘是一门交叉学科,它汇聚了数据库、人工智能、统计学、可视化、并行计算等不同学科和领域,近年来受到各界的广泛关注。

一般说来,数据挖掘是一个利用各种分析方法和分析工具在大规模海量数据中建立模型和发现数据间关系的过程,这些模型和关系可以用来做出决策和预测。它强调对大量观测到的数据库的处理。它是涉及数据库管理、人工智能、机器学习、模式识别、及数据可视化等学科的边缘学科。

作为一门处理数据的新兴技术,数据挖掘有许多的新特征。首先,数据挖掘面对的是海量的数据,这也是数据挖掘产生的原因。其次,数据可能是不完全的、有噪声的、随机的,有复杂的数据结构,维数大。最后,数据挖掘所采用的技术涉及到:数据库、人工智能、统计学、可视化、并行计算等不同学科和领域。

二、统计学的含义

统计学最初是作为一门实质性科学建立起来的,它从数量上研究某类具体的现象(如社会经济发展)的规律,但是,随着统计学研究范围的不断扩大以及统计方法在社会领域和自然领域内的有效应用,加之统计方法体系本身的不断发展和完善,使得统计学的研究对象也发生了变化。统计学已从实质性科学中分离出来,转而研究统计方法,成为一门方法论的科学。即统计学是研究如何搜集数据、整理数据和分析数据的一门方法论科学。

从本质上看,统计工作的核心就是数据(或者信息)的采集、分析和处理,正如权威的不列颠百科全书将统计定义为“statistics:the science of collecting,analyzing,presenting,and interpreting data”即“统计:收集、分析、表述和解释数据”

三、数据挖掘与统计学的比较

数据挖掘来源于统计分析,而又不同于统计分析。数据挖掘不是为了替代传统的统计分析技术,相反,数据挖掘是统计分析方法的扩展和延伸。大多数的统计分析技术都基于完善的数学理论和高超的技巧,其预测的准确程度还是令人满意的,但对于使用者的知识要求比较高。而随着计算机能力的不断发展,数据挖掘可以利用相对简单和固定程序完成同样的功能。新的计算算法的产生如神经网络、决策树使人们不需了解到其内部复杂的原理也可以通过这些方法获得良好的分析和预测效果。

由于数据挖掘和统计分析根深蒂固的联系,通常的数据挖掘工具都能够通过可选件或自身提供统计分析功能。这些功能对于数据挖掘的前期数据探索和数据挖掘之后对数据进行总结和分析都是十分必要的。统计分析所提供的诸如方差分析、假设检验、相关性分析、线性预测、时间序列分析等功能都有助于数据挖掘前期对数据进行探索,发现数据挖掘的题目、找出数据挖掘的目标、确定数据挖掘所需涉及的变量、对数据源进行抽样等等。所有这些前期工作对数据挖掘的效果产生重大影响。而数据挖掘的结果也需要统计分析的描述功能(最大值、最小值、平均值、方差、四分位、个数、概率分配)进行具体描述,使数据挖掘的结果能够被用户了解。因此,统计分析和数据挖掘是相辅相成的过程,两者的合理配合是数据挖掘成功的重要条件。

四、小结

数据挖掘理论与技术的产生,促进了统计学发展的同时,也提出了更多的挑战。如何更好地使用数据挖掘和统计为解决社会实际问题做出贡献,是统计学家和数据挖掘研究者共同关心的话题。数据挖掘和统计学应该相互学习和渗透,各自分工,协同工作,共同为挖掘隐藏在复杂现象背后的有价值的知识贡献力量。

参考文献:

[1]Jiawei Han,Micheline Kambr.数据挖掘――概念与技术(影印版)[M].北京:高等教育出版社,2001

[2]韩明.数据挖掘及其对统计学的挑战[J].统计研究,2001,8

统计学分析数据范文2

关键词:数据分析;统计;数学;教学策略

中图分类号:G623.5 文献标志码:A 文章编号:1008-3561(2017)12-0027-01

能够根据具体问题背景选择合适的统计图是学生统计素养的一个重要内容,也是学生对数据分析能力的一个表征。扇形统计图是在学生认识了条形统计图、折线统计图后的小学阶段的最后一个统计内容,该内容增加了选择合适统计方法的难度,使“数据分析”变得尤为重要。因此,教师在教学中要以数据为载体,以学生原有知识经验为基础,引导学生展开渐进式思考,探寻统计的有效方法,培养数据分析观念。

一、引发认知冲突,点燃统计内需

学习是一种由外而内的过程,学习最大的动力来自学生心灵深处,源自于自身的认知冲突。教师在教学中创设教学情境的目的正是为了借助外部环境的刺激,引发学生的内部认知冲突,促使学生在矛盾中生成新的需要,将学习不断引向纵深。苏教版六年级下册的“扇形统计图”一课意在使学生通过联系百分数的意义,体会扇形统计图描述数据的特点。为了让学生深刻领会扇形统计图的特点,教师在教学中改变了教材的编排顺序,没有直接出示例题中的扇形统计图,而是引导学生感知数据,造成他们认知上的矛盾冲突,点燃他们新的统计内需,逐步引出扇形统计图。教师这样给学生出示例题:我国陆地总面积大约是960万平方千米,其中丘陵占9.9%、山地占33.3%、高原占26.0%、盆地占18.8%、平原占12.0%。“同学们能否根据数据设计出一个统计图反映出我国陆地各地形分布情况?”教师边出示条件边提问。学生一听说设计统计图,马上联想到以前学习的内容,有的说:“我们可以画出条形统计图。”有的说:“我们可以设计成折线统计图。”教师表扬了学生善于联系旧知的意识后说:“请同学们想一想条形图与折线图分别用来反映什么?例题中的数据表示什么含义,可以用它们来表示吗?”教师的提示唤醒了学生的数据意识,经过对数据的观察与思考,学生们一致认为:“条形统计图用来直观反映数量多少,折线统计图反映了数量的增减变化,这道题中的数据都是百分数,表达的是部分量与总量的关系,看来以前学的那两种统计图不合适。”“那该怎么办呢?”一个女生迫不及待地问道。“是啊,我们该用怎样的图形来表示部分量与总量之间的关系呢?”教师故意装作不知,“看来我们必须另找出路了。”

二、引导自主思考,点化绘制图形

面对学生的急切心理,教师没有直接将“扇形统计图”推出,而是借助生活情境的观察感悟,引导他们自主思考,摸索出扇形统计图的特点和画法,逐步点化学生绘制出扇形统计图。“先请同学们来看一个有趣的拼盘。”教师边说边给学生展示了一张课前制作的地地形分布模型:用一个圆形塑料盘代表我国陆地总面积,在圆盘内用各种颜色的橡皮泥分别表示不同地形。教师用这个拼盘图对学生进行暗示启发,学生甲一点就通:“原来百分数关系可以用圆与扇形来表达,用一个整圆表示总量,用扇形表示各部分量。”学生乙补充道:“平原占12.0%,表示平原面积占我国陆地总面积的12.0%,我们可以用一个圆来表示我国陆地总面积,在圆内画出一个扇形表示平原面积。” 教师接着说:“同学们的悟性真高,像拼盘那样表示各部分量与总量之间关系的统计图我们称为扇形统计图。下面,就请同学们自己尝试着画出我国陆地各种地形分布情况统计图。”然后教师又引导学生根据各百分数的含义,讨论如何绘制出各个扇形。学生丙联系圆心角的知识道出了平原部分的画法:“一个圆是360°,360°的12.0%是43.2°,在圆内画出一个圆心角是43.2°的扇形就表示平原的面积了。”在学生丙的引领下,同学们迅速算出其他扇形的圆心角度数,并画出了完整的扇形统计图。

三、引领梳理反思,点醒对应思想

为了实现“教是为了不教”,教师在教学中经常引领学生梳理思路,反思学习得失,总结学习经验,使他们获得了质的提升。在学习“扇形统计图”一课的过程中,由于有了先前基于数据分析的精心引导,学生亲历了统计方法的选择与统计图的绘制,对扇形统计图的特点和作用了然于心,读懂扇形统计图自然不成问题。因此,在组织学生对统计图中的信息进行简单分析之后,教师增设了一个“回顾反思”环节,让学生回顾整个统计活动经历,使学生懂得了不同的问题背景需要用不同的数据分析方法,各种统计图的选用必须与数据意义相适应。如反映数量增减可选择折线图,要表达数量多少可选用直条图,要反映各部分量与总量之间的百分比关系可选择扇形统计图。高年级学生的类比分析能力比较强,教师让他们通过简要梳理与反思,能使他们明晰数据分析方法的选择的重要性,对数据分析方法的选择有清晰的认识,进而点醒他们的数学思想。

四、结束语

总之,统计教学是一个系统而完整的活动过程,从对问题背景的理解、对数据的解读、对统计方法的选择,再到图形的绘制等,这一切都离不开科学严谨的分析。数据分析是统计的核心,教师在统计教学中应以数据为核心,引领学生在科学分析中选择出合适的统计方法,从而圆满地完成统计任务。

参考文献:

统计学分析数据范文3

[关键词] 经济运行;数据;统计;分析

由于经济运行缺乏一整套制度化的计划测算、跟踪测量、监管分析、反馈改进工作模式,企业作为经营管理主体的作用没有得到有效体现。主要体现在:

经营计划指标分解测算的过程不透明,缺乏基层单位参与。有时计划目标测算下达不及时,基层单位无法及时作出工作安排,在一定程度上甚至影响到了基层单位主观能动性的发挥。员工工作没有计划,只是被动的服从上级工作安排,盲目性、随机性比较严重,不能调动和发挥全员的主观能动性,创新意识差。

市场一线的真实需求与实际工作脱节。经营计划下达后的督促落实不深入,缺乏自下而上的、全面的对阶段性经济运行数据的分析对比,无法发现数据后深层次的问题;对市场的真实需求缺乏分析研究,甚至出现购进卷烟的牌号长期压库,形成了滞销占用资金等现象。

重复劳动、数据失真影响工作质量和效率。缺乏系统、规范、明确的岗位职责、工作流程说明资料,当员工岗位调整变动或新进人员时,需要很长的时间来适应工作要求,严重影响了工作质量和效率。同时,不同部门整理汇集相同项目的数据时,往往存在数据差异和失真,无法保证正确的的数据分析和领导决策。

因此,建立完善一整套涉及事前、事中、事后的经济数据分析统计管理机制已势在必行,新机制围绕进一步提升统计工作对企业经济运行的参与,涵盖科学测算下达经营管理计划目标、及时整理汇总专销数据、定期开展经济运行分析查找问题、以三级考核促进问题改进提升的PDCA模式循环,管理重点由注重结果向注重过程逐步转变。具体来讲,我们主要采取了以下三点做法:

一、健全机制,规范经营管理计划测算下达流程

滨州市烟草专卖局(公司)编制印发了《经营管理计划编制下发管理办法》,对全市系统经营管理计划目标的测算、编制、下达等工作流程进行规范。在每个经营周期(年度、月度)前完成经营管理目标的测算、编制和下发工作,明确项目部门职责和计划目标的测算方法,采取自下而上的计划提报方式,由主管部门汇总整理,经分管领导审核批准后下发。

二、建立“综合数据资料库”,实现系统内信息资源共享

建立全市系统“综合数据资料库”。市局(公司)各部门根据职责编制“综合数据资料库”对应内容,需要进行社会调查的,向有关政府职能部门等进行广泛的社会调查活动。各单位和部门所负责的数据资料编纂完成后,要报市局(公司)牵头部门汇总、整理和审核。完成审核后统一上传市局(公司)内部网站,内部网站设立专门栏目,专门存放综合数据资料,作为综合数据资料的载体。内容涵盖地方经济发展、人口数据、企业概况、财务管理、卷烟经营、网络建设、专卖管理、客户商圈、信息化建设、安全管理、人力资源、制度建设、检查考核、岗位职责、工作标准及流程等具体内容。为了使综合数据资料的准确性、有效性,规定每季度对数据资料进行更新和调整。

三、丰富统计手段,定期开展经济运行分析

首先,建立健全经济数据统计分析制度,要求各单位、部门定期编报统计分析材料,综合信息科对全市系统的统计分析情况进行汇总整理,定期编印“全市系统经济运行分析报告”。其次,将经济运行统计分析工作纳入对各单位、部门的工作质量考核,对统计数据的准确性、报告报送的及时性等情况进行定期检查考核,并与薪酬分配挂钩。第三,定期召开全市系统经济运行分析会议,对经济运行数据统计分析进行阶段性通报讲评,以及时反馈统计分析中发现的问题,实现各项工作的持续改进。

四、加强分析深度广度、服务企业发展大局

在市局(公司)的经济运行分析会议上,统计部门采取了以幻灯片为影像载体、辅助现场讲解的崭新形式,对企业经营管理工作进行全面、深入、细致的数据分析,通过不断改进经营统计分析的方式和方法,注重在分析的深度和广度上下工夫,不断提高经济运行分析质量,努力做到给企业发展当好参谋,为领导决策提供依据。一是从打造一支企业经营分析人才队伍入手,统计部门注重对各级统计人员的业务技能培训,为做好经济运行分析工作提供人力资源保障。二是积极探索,采用新的数学模型实现统计工作的不断深入,例如我们对各单位的销量、单箱销售收入的测算采用了线性回归分析方法,将各单位卷烟经营指标与当地社会经济发展数据如人均GDP、人均可支配收入挂钩对比,进行认真细致的测算和对比分析,最终得出客观准确的结论。三是扩宽分析思路。不仅与自己对比分析,同时做到跳出滨州看滨州,与全省平均发展水平和先进地市进行对比分析,做到取长补短,对及时调整经营工作思路、指导经营工作发挥了积极作用。

通过采取以上措施,企业工作效率与质量稳步提升,全员执行力大大提高。数据资料库包含近年来的历史经营数据和客户资料。在编制测算经营管理计划目标时,可以直接借鉴和使用相关历史数据,根据一年来实际运行情况看,实际经营结果与测算的计划指标基本相符,实现了计划指标的可行性、合理性、科学性,对基层单位较好地发挥了指导、规范、激励的作用。综合数据资料库建成后,新进员工、岗位调整的员工可以迅速进入工作状态,同时降低了员工培训成本。全面开展经济数据统计分析工作不仅提高了全员特别是一线客户经理的工作能力,而且企业能在最短的时间内针对市场形势变化调整经营策略,提高了企业经济运行质量和水平。

总之,滨州市局(公司)实施的经济运行数据统计分析机制,为滨州烟草经营管理水平、企业效益的持续提升提供了有力支撑,是适合企业发展实际的创新之举,为促进滨州烟草既好又快发展起到了积极的推动作用。

统计学分析数据范文4

关键词:测评系统;需求分析;逻辑设计;E-R图;关系模型

中图分类号:TP311文献标识码:A文章编号:1009-3044(2010)08-1921-02

Analysis and Design of School Education and Teaching Evaluation System Database

PAN Guo-rong

(Changzhou Liu Guo-jun Higher Vocational and Technical School, Changzhou 213004, China)

Abstract: An evaluation database was designed based on the requriment analysis of the schooleducation and teaching evaluation system. It can realize themaintenance of the essential information, and the query and statistics of evaluation data. The needs analysis,conceptual design ,logical design etc. was disscussed in the entire design.

Key words: evaluation system; needs analysis; logical design; E-R diagram; relational model

学校教育教学情况测评是指学生对班主任教育情况及任课教师教学情况的评价,我校一直以来都非常重视学生对教师的评价。从1998学年开始,学校教务处会在每一学期的期中考试前或考试后,统一组织学生进行测评。最早采用的测评方式就是给每个学生发一张评价表格,测完后以班级为单位装订成册,供领导和教师查询,这种方式的主要缺点是查询不方便且无法统计分析;从2005学年开始,改为学生按评分规则填涂卡,教务处用读卡机读卡并统计,最后将所有测评情况汇总成册,供主要领导查阅,采用这种方式虽然能作一些统计,但统计方式单一、查询不方便,也耗费资源,班主任和众多任课教师很难及时、方便看到测评结果,尤其是学生对学校的意见、建议及评价信息。在学校加强信息化管理的大趋势下,学校于2008年初提出要开发一个基于计算机网络平台的学校教育教学情况测评系统(简称测评系统),以提高测评工作的效率,提升教学管理水平。

1 需求分析

需求分析是整个系统设计过程的基础,要收集数据库所有用户的信息内容和处理要求,并加以规范化和分析,这是最费时、最复杂的一步,但也是最重要的一步,它决定了以后各步设计的速度与质量。需求分析做得不好,可能会导致整个数据库设计返工重做。

测评工作在我校已开展多年,本人对测评过程也比较了解,该项工作的主要负责部门是教务处。教务室工作人员提供了原先使用的测评评价表(见图1)及测评情况汇总表,明确提出了对测评系统的要求,通过分析,主要有以下几方面的要求:

1)学生能在校园网上登录系统,并且每个学生登录的用户名及密码是不同的;

2)学生测评时是不记名的,并且只能对本班班主任及任课教师进行测评;

3)测评的项目见图1测评评价表所示,这些项目和分值是相对固定的,即项目数不变,项目内容和分值在不同的测评中会有所调整;

4)学校领导及教师能在校园网上登录系统并查询测评数据;

5)测评数据可以用多种不同的方式汇总并查询。

2 业务流程分析

根据对测评的需求进行分析,可以得出测评系统主要的业务流程如图1所示。

由以上业务流程,可以清晰地划分出三大处理部分,首先,教务部门人员在测评前要对本次测评所需的基本数据进行准备,即要维护好参与测评的班级、班级的班主任、班级的科目及任课教师等相关信息;其次,组织学生对班主任及任课教师进行测评;最后,领导和教师对测评情况进行查询。

3 数据库的分析与设计

3.1 概念结构分析与设计

概念结构设计是整个数据库设计的关键,通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型。测评系统数据库概念设计的表达工具采用E-R模型,基本过程如下:

1) 按照业务流程分析中划分出的三大处理部分,可以确定主要模块。

教师情况数据维护:对教师(包括班主任及任课教师)的基本信息进行维护;

课程情况数据维护:对课程的基本信息进行维护;

班级情况数据维护:对参与测评班级的基本信息进行维护;

班级科目数据维护:对参与测评班级的所授科目情况进行维护;

系统用户维护:对系统用户的基本信息进行维护;

学生对班主任的测评:学生对本班班主任的教育情况进行测评;

学生对任课教师的测评:学生对本班任课教师的教学情况进行测评。

2) 确定实体集。

在教师情况数据维护中实体集合有:教师;

在课程情况数据维护中实体集合有:课程;

在班级情况数据维护中实体集合有:班级,教师信息;

在班级科目数据维护中实体集合有:班级信息,课程信息,教师信息;

在用户情况数据维护中实体集合有:用户;

在学生对班主任的测评中实体集合有:学生信息,班级信息,教师信息,班主任测评信息;

在学生对任课教师的测评中实体集合有:学生信息,班级信息,课程信息,教师信息,任课教师测评信息。

3) 确定实体集之间的联系。

学生是属于班级的,教师与班级之间可能有两种不同的联系,一是教师担任班级的班主任,二是担任任课教师,一个班级开设有多门课程,每门课程可以有1位或几位任课教师,通过分析不同实体之间的联系,便于设计数据库完整性约束。

4) 确定实体和联系的属性。

按前面分析及系统要实现的功能,可以设计出各个实体及联系的属性。学生是一个比较特殊的实体,从理论分析看,学生是参与测评的主体,系统中应该有这个实体,而从测评系统具体实际出发,测评时只需记录一个学号,不需要学生姓名等其他信息,因此,系统中不设计这个实体。

5) 画出局部E-R图。

分别画出班级选择科目及测评的E-R图,如图2、图3所示。

6) 集成局部E-R模型。

形成全局E-R模型,如图4所示,其中系统用户实体未画出。

3.2 逻辑结构设计

逻辑结构设计的任务就是把概念结构设计阶段设计好的基本E-R图转换为与选用的具体机器上的DBMS产品所支持的数据模型相符合的逻辑结构,并对其进行优化。

1) 将实体与联系转化为表。

在概念结构设计阶段已画出全局E-R模型,现在只要利用范式理论,将实体和联系转化为关系型数据库管理系统中的表,将实体中的属性转化为表中的属性。测评系统所选用的DBMS为Microsoft SQL Server2000,一般可以利用SQL语言来实现数据库、表、属性等的创建,并完成所有表及表之间的实体完整性、参照完整性约束和用户自定义完整性约束。

2) 数据模型的调整与完善。

数据库逻辑设计的结果不是唯一的,可以根据应用需要对设计结构进行适当的修改和调整,以期进一步完善设计,提高应用系统的性能。本测评系统中,学生测评完毕后,领导和教师要频繁统计查询测评结果,因此在表中增加适当的冗余是必要的。

4 结束语

数据库设计是管理信息系统开发过程中非常重要的一个环节,在进行数据库设计时,应该准确了解用户需求,以便设计出符合实际需要的数据库。本人开发的基于Struts框架结构的测评系统已经在学校成功进行了4次测评,在最近的一次测评中,有90个班级近4300名学生参与了测评,同时在线参测学生达400人,查询统计非常及时方便,大大提高了教学管理的效率和水平。系统的实际运行证明,测评系统中数据库的设计是规范的,运行是稳定的、可靠的,完全满足系统的要求。

参考文献:

统计学分析数据范文5

1 测试项目和器材

①身高体重;采用身高体重仪测试。

②800米(女)、1000米(男)跑;手动计时电子秒表。

③肺活量;电子测量仪。

④立定跳远;皮尺丈量。

⑤坐位体前屈;电子测量仪。

2 参测人数

882人,测完5个项目共869人,其中男生为416人,女生为453人。

3 《学生体质健康标准》得分等级分析

3.1 学生身高标准体重的比较

从表5、表6可以看出,不及格率低于设计比例,这说明我市高中总体合格率较高。但是良好率和优秀率远低于设计比例,并且女生优于男生。

从表6和表4对照分析,总体良好率和优秀率都低于单项的良好率和优秀率,这说明了我市高中学生身体发展水平不均衡,某些项目水平较高,某些项目水平较低。

3.4 结论。

3.4.1 我市高中学生总体营养不良率为6.56%,高于国家设计比例4.56%;较轻体重率为60.64%,高于国家设计比例47 64%,这应该引起学校、家庭和学生的重视,讲究科学膳食和科学健身。

单项的良好率和优秀率都高于总体的良好率和优秀率,这说明学生身体发展水平不均衡。

4 建议

4.1教育部门要加强对中小学校体育课开课检查力度,确保学生每天锻炼一小时。中小学要认真执行国家课程标准,保质保量上好体育课。

4.2 恢复初中体育中考,从而增强学生和学校重视体育锻炼。

统计学分析数据范文6

(池州学院数学系安徽池州247100)

摘要:随着我国社会的不断进步和科学技术的迅猛发展,数理统计也处于一种不断完善和发展的过程中,在当前众多领域得到了普遍的应用。因此,如何加大数理统计在大数据分析中的应用,保障统计工作高效的进行,是当前迫切需要解决的问题。本文研究探讨信息时代背景下数理统计在大数据分析中的应用,首先从数理统计的研究内容分析出发,然后对数理统计的特点进行了简要的阐述。最后对信息时代背景下数理统计在大数据分析中的具体应用进行了深入的分析。希望为今后数理统计在大数据分析中发挥出更大的应用作用,奠定一个具有参考价值的文献基础。

关键词:信息时代;数理统计;大数据分析;应用研究

在进行科学研究的过程中,经常会遇到描述两个及以上的随机变量、描述随机变量的分布特征、离散性质或变量大小等等相似的问题,如果不借助于数理统计,就不可能有效的解决这些问题。数理统计这一数学工具的出现,在我国社会的不断进步和科学技术的迅猛发展的过程中处于一种不断完善和发展的状态之中,在当前众多领域得到了普遍的应用。众多学者开始考虑如何更加有效的应用数理统计方法去解决具体的数据分析问题,这成为了数据分析过程中非常关键的部分,也是当前针对数理统计研究最多的一类问题。

一、数理统计的研究内容分析

数理统计的研究内容,主要包括数理统计在数据分析及数据处理中的基本定义、概念,以数据分析中数理统计的广泛应用为重点。此外,对数理统计的相关理论进行深化,总结数理统计及实践操作的特点等等也是当前关于数理统计研究的重要方面。同时,如何有效的将数理统计应用于企事业单位当中以及数理统计对企事业范围统计工作的价值也是一个重要的方面。

二、数理统计的特点

数理统计的特点主要是基于数据分析而言的,具体表现为通过参考数据资料,将对应的数学模型应用到随机现象中,借助于有价值的数据,实现数据应用于数学模型的检验,从而对数据背后主体的规律、性质以及特点等等内容进行反馈。另外,数据分析以及数理统计二者之间有着非常大的关联,不仅仅是一个简单的、固定形态的统计来的一一对应关系。因此,由于数据分析的需要而逐渐演化出来的数理统计方法,实现了数据主体到数据分析、数据分析到数据主体的循环路径,为最大程度的发挥出数据价值奠定了一个非常重要的基础条件[4]。

三、信息时代背景下数理统计在大数据分析中的具体应用

数理统计对于大数据的处理主要可以通过数理统计方法实现。在当前,每一个学科对于数据的处理都有自己对应的数据分析方法,而数理统计方法就是众多学科中交叉的方法,对研究社会活动的各个领域和不同学科之间的研究有着非常大的帮助[5]。因此,数理统计在数据分析中占据的重要的地位。随着其不断的发展,也慢慢形成了数理统计理论,并有效的应用于数据分析。通过大数定律,数理统计与数据分析之间产生了相互依赖的关系,总体的相对数及平均数等等相关性指标在数据分析中都可以发挥作用,同时也是建立在大量观察的基础之上实现的。

数理统计在数据分析的过程中发挥重要作用的同时,也会对数据分析产生一定的影响,主要体现在以下几个方面。一是数理统计会对数据的总体分布形态、方差分析以及正交设计、相关分析等等产生显著的影响,可能是正向的回归效应,也可能是负面的偏离效应[6]。二是数理统计还可以通过其模型的构建去修正,对数据分析的均值以及方差等等统计学变量产生不同程度的影响。

四、结语

作为一项重要的工作,统计工作必须要依靠数理统计的方法和模式,才能够充分发挥出应用价值。数理统计这一工具的出现,成为了解决数据分析中常见问题的有效手段。在我国社会的不断进步和科学技术的迅猛发展,数理统计也处于一种不断完善和发展的过程中,在当前众多领域得到了普遍的应用。因此,如何加大数理统计在大数据分析中的应用,保障统计工作高效的进行,是当前迫切需要解决的问题。本文研究探讨信息时代背景下数理统计在大数据分析中的应用,首先从数理统计的研究内容分析出发,然后对数理统计的特点进行了简要的阐述。最后对信息时代背景下数理统计在大数据分析中的具体应用进行了深入的分析。希望为今后数理统计在大数据分析中发挥出更大的应用作用,奠定一个具有参考价值的文献基础。

参考文献:

[1]胥洪燕,陈梦雨.数理统计在数据分析中的应用研究[J].现代商业,2014,05:126.

[2]陈建桦.用数理统计的方法对检测中出现可疑数据的处理[J].家电科技,2008,01:62-64.

[3]颜钟得.磨损试验数据的数理统计处理方法[J].理化检验(物理分册),1995,01:45-46.

[4]颜钟得,谢致薇.静态磨损试验数据的数理统计分析[J].广东工业大学学报,2007,01:50-52.