化学数据分析方法范例6篇

化学数据分析方法

化学数据分析方法范文1

〔关键词〕大数据;情报学;研究方法;非结构化数据

〔中图分类号〕g250.2〔文献标识码〕a〔文章编号〕1008-0821(2013)08-0058-03

大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理,并整理成为帮助企业经营决策更积极目的的资讯。

随着云时代的来临,大数据(big data)也吸引了越来越多的关注。《著云台》的分析师团队认为,大数据(big data)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像mapreduce一样的框架来向数十、数百甚至数千的电脑分配工作[1]。所以大数据时代对于各个学科的要求都提高了很多,对于情报学专业而言,大数据时代同样带来了很多挑战和机遇。

1大数据时代情报学面临的挑战

进入2012年之后,“大数据”一词被越来越多的人所提及,它用来描述信息大爆炸时代产生的海量数据,时至今日“大数据”的研究价值已经可以和黄金相媲美。所谓“大数据”顾名思义,首先是数据量要大,但是并不是数据量大的数据都可以称之为大数据,ibm公司大数据的特点是4个v:volume(大量)、velocity(高速)、variety(多样)及veracity(真实),它提供了在新的和正在出现的数据和内容中洞悉事物的机会,使业务更加灵活,并回答以往没有考虑到的问题[2]。gartner公司的报告也提出,大数据是大容量、高速和多样化的信息资产,它们需要新的处理方式,以提高决策能力、洞察力和流程优化[3]。

在笔者看来,“大数据”还应该加入一个特点就是海量资料之间的关联程度。如果有一批更新速度极快的多样真实的大量数据,将这批数据看作一个整体,每个单独的数据看作是整体的一个组成部分,这些组成部分之间毫不相关,数据彼此很孤立,数据间的关系不清晰很难捉摸,看上去并不像一个整体,相反地更像是一盘散沙。这种零散的海量数据之间的关系断裂,其关联程度很低,也就导致其含金量减少,不能形成所谓的“大数据”。

由此可见,大数据时代的背后其实有更加深刻的理念,同时这些理念也为情报工作者带来了新的挑战。

(1)大数据时代从字面上理解只是进入了一个海量数据时代,而实际上大数据时代更深刻的理念在于它带领我们进入了数据分析时代,数据的分析随着大数据时代进入了一个前所未有的黄金时期,如何从海量数据中获取有用的信息成为情报工作者面临的新挑战。

(2)大数据时代的另一个特点就是其多样性。进入大数据时代之后,数据的种类除了包括一部分结构化的数据以外,还包括很多非结构化的数据,例如文本、音频、视频等很多形式的数据。情报工作者要挖掘的某些规律可能隐含在各种形式的数据中,而同一种形式的数据又有可能含有很多规律,如此一来,大数据时代就要求情报工作人员的统筹兼顾,不能漏过任何一种类型的数据。

(3)大数据时代不仅仅是数据量的巨大,其最主要的特点还有velocity(高速),这一特点就迫使情报工作人员必须打破以往的人工分析的工作模式,计算机智能分析将成为未来大数据时代数据分析的主流技术。

在大数据时代中,要求将情报学和其他各个学科相结合,在其他学科的各个领域内应用情报学的知识对海量的数据进行分析研究,并将各个学科领域内的研究都归为情报学的一个组成部分加以建设,情报学自身的优势何在,劣势何在,如何把握大数据时代这一机会进一步进行学科的完善,是我们应该思考的问题。

2情报学在大数据时代的发展趋势

大数据时代的变革将会引领情报学进入一个崭新的发展阶段,英国莱斯特大学的markphythian教授在2008年发表了题为“intelligence analysis today and tomorrow”的报告中指出[4]:①获知情境是非常重要的。忽略战略环境、领导作风和心

因素等更广泛的问题,都会引起情报研究的失误;②加强信息之间的关联。美国政府内部信息共享的障碍,分析人员无法获得足够的信息,以支持分析活动,导致情报研究预测失败;③要学习更多外部的专业知识。这一举措虽然不能保证分析的成功性,但将是竞争分析的重要信息来源。

在大数据时代背景下,通过对国内外学者和专家的研究成果的研究,笔者认为情报学未来发展的三方面趋势:①情报学将会从原来的单一学科的研究转变为多学科交叉结合研究;②情报学研究中数据的采集和获取范围将会从单一的结构化数据转变为加入更多的非结构化数据;③情报学的分析方法将会从原来的人工分析为主体转变为计算机智能化为主体的智能分析。

2.1单一学科的研究转变为多学科交叉结合研究

情报学是信息大爆炸时代的新兴学科,而面对大数据时代,信息量不但巨大而且更新速度极快,传统的情报学研究方法已经不能满足大数据时代人们对于信息处理的需求,传统的情报学更多的是处理结构化的数据,而大数据时代给我们带来更多非结构化的数据,非结构化数据的处理不是基于数学和逻辑运算,而主要是基于对内容含义的理解和语义分析,包括各种形式的分类、检索、信息抽取和内容匹配等方法。传统数据库技术,例如sql语言在设计之初仅考虑了结构化数据,在海量非结构化数据中已然无用武之地。

未来情报学在发展中应该汲取各个领域的不同学科的方法和优势,开创更多新型的研究方法来应对“大数据”的处理问题,而在非结构化数据的包装下其数据的本源是什么,数据的含义何在,这些问题在以后的情报学研究中就需要涉及到本体论的相关应用来解决。为了顺应大数据时代的需要,面对高速产生的繁杂的海量数据,本体思想无疑是解决内容含义和语义分析最有力的武器。  此外,对于很多企业的数据资源,情报学这一学科需要研究的除了用户的行为挖掘之外,还要运用很多其他学科的知识进行辅助分析,例如心理学的相关理论已经逐步被引用到情报学领域,并起到辅助数据分析的作用,而情报学反过来在应用其他专业知识的同时也可以为其他专业提供新的思维和引导。如此一来,多学科交叉将会增多,多学科交叉研究将会成为未来情报学以及其他学科为顺应大数据时代的一个发展方向。

2.2情报学研究中数据的采集和获取范围将会从单一的结构化数据转变为加入更多的非结构化数据不同信息源可以从不同角度揭示问题,如专利、研究出版物、技术报告等,可以较为直观地反映研究者对某科技问题的理解与描述,而评论文章、科技新闻、市场调查等,可以反映出社会对该科技的观点、认知情况[5]。

在大数据时代,情报学这一学科需要研究的数据量更大,数据类型更多,很多在别人看来是无用的数据,在情报学看来它们可能是最有价值的资源,情报学在大数据时代更多的要学会“捡垃圾”,在海量资源中获取数据的同时不能忽略任何一个可以找到信息情报的数据,可能某一数据表面看来毫无用处,但是当这个数据和其他数据整合在一起后就有可能是打开整个数据挖掘大门的金钥匙。

虽然情报学的很多研究方法在处理非结构化数据方面不是强项,比如情报学的一些分析方法,在处理图像信息和影音信息方面显得后劲不足,但是在研究中同样不能忽略这些资源,这也对情报工作者技术方面提出了更高的要求,开发新技术,更好的对数据进行分析将是情报学未来面对的难题。而为了得到更优质的研究结果,从单一结构化数据的采集和获取转变为加入更多的非结构化数据将会是情报学研究的必然趋势。

2.3情报学的分析方法将会从原来的人工分析为主体转变为计算机智能化为主体的智能分析正如美国国家科学基金会(nsf)的报告[6]所说,美国在科学和工程领域的领先地位将越来越取决于利用数字化科学数据以及借助复杂的数据挖掘、集成、分析与可视化工具将其转换为信息和知识的能力。

由于非结构化的数据的大量引入,情报学不可避免的将面对一场技术上的革命,而传统的人工分析不仅浪费人力资源,而且根本无法适应高速产生的数据群。开发计算机智能分析技术势在必行,在技术上,计算机智能化分析将会以更快的速度解决不断增长的海量数据,达到节约时间提高效率的作用。从数据类型方面,很多数据并不是传统人工方法可以完成的,例如分析视频和音频,这就需要新技术的支持,未来如果不开发计算

机智能化新技术,将会导致很多视频和音频数据不得不被放弃掉。

计算机智能化新技术可以解放更多的人力去做更有价值的研究,同时也是大数据时代进行高速数据处理,高速数据挖掘的需要。未来情报学中计算机智能分析模型的建立将会对情报工作者提出更多的要求,情报工作者除了有数据分析和挖掘的能力之外,还应该具有数学逻辑思维来辅助计算机智能化模型的建立,传统的人工分析为主体的分析方法,必然会被计算机智能化分析方法所取代,这不仅是大数据时代的要求,也是当今社会发展的必然趋势。

3大数据时代情报学的机遇

狄更斯曾经说过“机会不会上门来找,只有人去找机会。”而大数据时代的来临,无疑是为情报学的学科发展创造了契机。情报学还是一个比较年轻的学科,大数据时代的到来也显示出情报学的“年轻”之处,如何将情报学进行完善,如何让情报学走向成熟,这都将会在大数据时代中找到解决的机遇。

3.1完善学科技术和方法

美国mckinsey global institute在2011年5月了研究报告“大数据:创新、竞争和生产力的下一个前沿领域”[7]。报告分6个部分,其中第二部分讨论了大数据技术,并围绕大数据分析技术、大数据技术和可视化三方面进行了阐述。在大数据分析技术中,列举了26项适用于众多行业的分析技术,包括a/b测试、关联规则学习、分类、聚类分析、众包、数据融合和数据集成、数据挖掘、集成学习、遗传算法、机器学习、自然语言处理、神经网络、网络分析、优化、模式识别、预测建模、回归、情感分析、信号处理、空间分析、统计、监督学习、模拟、时间序列分析、无监督学习和可视化[8]。

大数据时代,无论是数据量还是数据类型,都要求情报学这一学科对于自身的技术和研究方法进行一次变革和完善,以往的技术不能解决的问题,在大数据时代的今天将会得到解决;以往的方法不能研究的问题,在大数据时代也将得到研究,这也是技术和方法的升华。大数据时代的到来,可以为情报学这一学科提供更强有力的数据处理分析工具和方法。

数据分析虽然是情报学的研究内容,但是大数据时代的契机下更多的人才进入这个领域,这样就使数据分析方法汲取百家之长,从各个方面得到了完善和发展。同时情报学在完善技术和方法的同时也将会开创更多的新技术,为将来更多的研究做铺垫,情报学专业将会在大数据时代逐步走向成熟。

3.2情报学将会更加受到重视

很多人曾经认为没有必要设置情报学专业,甚至网络中有人将情报学列入20个无用的专业之一。但是在大数据时代,任何一个行业想在海量数据中进行“淘金”,都需要情报工作人员的介入,事实验证情报学的一些比较成熟的研究方法是其他专业不能比拟的,在情报学对数据挖掘的能力面前,曾经看着无用的垃圾信息将会是揭示某种规律的关键性信息。

情报学专业在大数据时代应该抓住机遇展现自身的优势,顺应潮流发展,让更多的人看到情报学专业的闪光点,进一步对学科建设进行完善,使情报学充分的与数学、经济学、心理学等其他学科结合起来,从而使情报学更为成熟,成为数据挖掘和数据分析中的领头羊。

3.3情报学人才的培养

情报学未来开发新技术,研究新方法无疑是需要更多的人才培养,这就需要更多跨专业人才进入情报学,在招收情报学方面人才时应该更加注重人才在学科中的交叉,不同学科人才的思维方式不同,不同学科人才的专长不同,不同学科人才所了解的研究方法也是多种多样。未来情报学要抓住大数据时代的契机,对各类人才进行吸收,从而使情报技术更为完善,使研究方法更为广泛。同时现有的情报工作者也要注重自身的培养,与时俱进,多涉及一些其他领域的知识,使自身的研究领域得到更好的完善。  4结论

综上所述,大数据时代为情报学带来了很多难题,也带来了很多技术和方法上的困难,但与此同时,大数据时代也为情报学带来了更多的发展,机遇。本文从大数据时代背景下情报学发展趋势和面对机遇方面出发,为情报学未来发展提出了建议,希望可以为以后的研究者提供些帮助。

参考文献

[1]http:∥baike.baidu.com/view/6954399.htm[eb].2013,(1).

[2]what is big data[eb/ol].http:∥www-01.ibm.com/software/data/bigdata/,2013-01-16.

[3]big data in little new zealand[

eb/ol].http:∥techday.co.nz/itbrief/news/big-data-in-little-new-zealand/24518/,2013-01-16.

[4]intelligence analysis today and tomorrow[j].securitychallenges,2009,5(1):67-83.

[5]alan l.porter,scottw.cunninghan.tech mining exploiting new technologies for competitive advantage[m].john wiley & sons,2005.

[6]nsfs cyberinfrastructure vision for 21st century discovery[eb/ol].http:∥nsf.gov/od/oci/civ5.pdf,2013-01-16.

化学数据分析方法范文2

宏观经济统计分析是建立在经济学、统计学基础上,伴随中国社会主义市场经济发展而逐步完善起来的。近年来,随着市场化进程的加快,特别是在信息技术的推动下,大数据时代的到来,对于宏观经济统计分析提出了更多挑战。面对新的情况,如何从统计学知识体系来渗透经济分析方法,并从宏观经济统计分析中的问题来探讨其发展趋向,对于提升我国宏观经济统计分析的科学水平具有重要的现实意义。

关键词:

宏观经济统计分析;统计方法;关键问题

从概念上来看,宏观经济统计分析是建立在经济学、统计学知识体系基础上,以统计知识为核心,围绕经济学知识进行研究和分析。在我国社会主义市场经济体制下,宏观经济统计分析的内容也经历了几个不同发展阶段。在以计划经济为主时期,宏观经济统计分析主要运用计量经济学知识,利用数理统计和模型分析,来完成对国民经济运行系统的优化和平衡。同时,借助于政府统计系统,从国民经济运行相关数据分析中,对计划执行情况进行研究,改进下一阶段计划经济重大问题。这一时期的计划经济为宏观经济统计分析提供了基础数据,但是,对于统筹兼顾、优化管理为主体的计划经济管理思想是一以贯之的。从我国统计学发展历程来看,对于宏观经济统计分析的内容,概况的讲,主要是围绕国民经济主要经济指标来展开,如利用国民经济账户、投入产出、资金流量表、国际收支平衡表等,从各个核心部门、核心指标、核心统计体系中来分析国家、产业的发展状况,减少经济危机的发生。改革开放以后,我国宏观经济统计分析,借鉴了马克思社会再生产、计划经济管理理论,同时借鉴了国民经济核算体系理论思想,完善了我国国民经济综合平衡统计方法,逐步实现了财政、信贷、外汇、物资的四大平衡。在以信息社会、大数据时代为特征的第三阶段,宏观经济统计分析将实际问题作为研究重点,特别是经济学与现实问题的关联,大数据环境下数据的可比性,统计分析方法的科学性和实效性等。

一、宏观经济统计与宏观经济统计分析概念研究

我国国民经济统计主要依托国民经济核算体系,包括经济循环理论下的宏观经济统计指标体系,以及各类标准、统计分类等内容。宏观经济统计,从概念上理解为从宏观上来探讨经济运行过程及结果的统计测度理论和方法。从统计范围来看,主要从经济活动中来获取统计数据,包括各类经济活动的信息整理、也包括各类统计部门设计的用于统计实际数量的调查资料。统计学是依据统计学理论,运用统计学方法来对各类经济信息进行统计分析,如利用抽样调查来进行统计分析,以实现对样本总量的推断;在获取相关统计数据内容时,常用的统计方法有分类法、关联统计法、变化率统计法、总量统计法、结构统计法等。信息化社会的发展,特别是基于网络技术的电子商务平台的建设,使宏观经济统计分析的独立性和地位更趋重要。概括来讲,经济统计分析从统计方式、统计数据上来全面认识经济获得,并从有效分析中提升经济发展水平.宏观统计数据的测度方式及搜集方法,与传统的调查方法,如普查、抽样调查、统计报表相类似,在现代经济统计中,增加了软统计内容,如抽样问卷、心理量表等。宏观经济统计分析是建立在宏观经济统计基础上,利用统计学理论和方法,以实证经济分析来处理统计结果。从概念上来看,广义的宏观经济统计分析包括的经济活动较多,不仅有重要的宏观经济指标内容,还有其他与国民经济管理相关的统计分析。微观来讲,宏观经济统计分析主要从经济问题的统计分析研究中,来构建统计分析模型,并从统计分析变量或指标中探析统计数据所反映的结果。

二、宏观经济统计分析体系研究

1.宏观经济统计分析内容

宏观经济统计分析体系包括宏观经济学目标、宏观经济管理目标和宏观经济统计目标三项内容,对于宏观经济学目标,主要从宏观经济统计分析对象,如社会总供给、总需求等建立均衡统计分析,从国民收入分配统计分析中来构建各项统计指标,如产业结构统计分析、经济周期统计分析、知识经济发展与创新统计分析、消费-投资需求分析、通货膨胀统计分析等等。宏观经济管理目标主要从宏观经济运行体制及组织结构上,围绕国家经济社会重大战略开展统计分析。如创新型国家经济战略、科教兴国战略、财政政策、货币政策、城镇化区域发展战略、可持续发展战略等等。宏观经济统计目标主要从国家统计、部门统计、行业统计、区域统计等层次化统计数据基础上来开发,围绕社会创新、政府管理、科学研究等内容展开统计方法创新。

2.宏观经济统计分析问题

宏观经济统计分析是政府统计工作的重要内容,一方面归结为制度化的统计分析工作,另一方面表现为专题型或问题型统计分析工作。在制度化统计分析工作中,围绕政府统计调查指标体系,从宏观经济运行过程及结果中来搜集数量特征、数量关系,并从宏观经济运行情况综合表现上来剖析主要问题和成功之处;对于各项宏观经济政策措施的执行情况进行跟踪,对执行效果进行对照分析,并从存在问题中来提出应对建议。如国家统计局和各下属统计单位,每年要对上一年度的统计工作进行汇报,以经济分析白皮书形式进行综合。制度化宏观经济分析工作,能够从社会生产、市场供需、收入分配、金融市场化、国际收支等多方面进行呈现,既有动态指标,也有近期、中长期发展趋向分析。宏观经济专题统计分析具有灵活性和变化性,主要是围绕不同时期的经济工作,从经济问题中来展开针对性调查统计分析。其特点表现在:一是对所研究的问题或专题具有较深的研究;二是多采用多重调查方法来实现对专题问题的全面分析,如抽样调查、软实力调查、问卷调查等的综合使用;三是运用现代信息技术来提升统计分析能力,特别是用网络化平台技术来弥补传统调查方法的不足,改善数据质量等。

三、宏观经济统计分析方法研究

宏观经济统计分析方法具有多样性,针对不同问题,有搜集数据、整理数据方法,也有针对经济问题的分析方法,还有基于统计描述和探索性数据分析方法。总的来看,对于宏观经济统计分析工作,多种方法的综合运用有助于提升宏观经济统计分析的科学性和有效性。对于宏观经济统计分析,不同领域所涉及的统计方法具有交叉性。但对于宏观经济分析中动态经济分析、静态经济分析、比较动态经济分析、比较静态经济分析方法所反映的经济学问题,能够从全面质量管理方法中体现目标、过程、方法、绩效、因素等统计描述信息,改善统计分析的应用实效性。主要常用的方法有因素分析法、指数分析法、弹性分析法、时间序列分析法、应用回归分析法和多元统计分析法等。对于不同经济变量体系的描述,根据经济运行过程及数量特征,从所选定的指标变量上来进行估计,包括推算、核算和估算等方法。描述性统计分析方法是基于统计分析应用,从构建基本逻辑架构中来分析客观存在的相关变量之间的关系;由于经济活动中各经济关系之间存在动态性,需要从经济分析的聚类、因子分析等方法中,运用分层回归、分位回归以及协整分析方法来转换,以促进对各项分析指标体系进行综合评价和反映。同样道理,在宏观经济统计分析方法研究中,面对大量微观性数据,如何发挥统计变量测度及过程变量特征分析优势?实践中常用统计系统描述方法,将系统分类及归纳至分位、分层、立体、动态的复杂系统中,从探索各关系变量及因素之间关系上来进行描述性分析。如在人口普查以及经济普查中,对于各类模拟系统方法的运用,主要从各因素的顺序识别和组内方差缩小、组间方差扩大上来实现动态过程的科学推断,提升核心主体的统计分析精度。

四、宏观经济统计分析的趋向研究

从宏观经济统计分析的应用来看,当前社会环境下面对更多挑战,其主要研究方向有以下几点:一是做好对国家经济社会发展管理的重要决策导向研究,特别是在信息技术快速发展背景下,从海量数据分析中来挖掘科学的信息资源,来优化和辅助市场化竞争、产业竞争及区域、国际间的竞争需要。哈佛大学加里·金(GaryKing)提出“信息革命背景下,对于海量数据资源的统计分析,将席卷商业界、学术界和政界”。建立在大数据基础上的精细化测量行为研究,从经济领域、商业领域来拓宽延伸,以促进社会发展;二是顺应大数据时代的发展机遇,在中国特色社会主义市场经济转型关键期,从协同政府、行业、经济、社会发展关系的角度,以政府公共数据共享平台建设来完善社会发展科学管理水平,从中长期发展政策分析中来进行科学谋划和实施。对于统计信息平台中的活动、业务、行政记录、财务信息等资料,要按照统计数据的统一化要求进行科学转换,增强宏观经济统计分析的决策科学化能力;三是强化创新型国家建设统计分析工作,围绕国家创新能力、国家创新体系建设发展要求,从国家科技政策制订,到各项经济统计工作的实施,都应扎实推进宏观经济统计分析在经济建设中的核心和驱动地位;四是构建高端化的产业结构统计分析模型,围绕我国全面转型过渡期的产业结构现状资料,从构建“三高一低”产业结构高端化统计目标入手,加大对信息化金融产业的创新,延长产业价值链,增强产业辐射及带动作用,优化产业结构向高端化进程转移;五是注重金融统计分析,完善我国金融管理体系,提升金融管理效率。在建设金融服务业与其他产业的协同发展上,发挥统计手段来全面跟踪和优化我国货币政策服务环境,挖掘金融数据,加大金融风险监测和防范;六是注重宏观经济空间统计分析,依托大数据时代数据集中化平台,为宏观经济统计分析创造有利环境,实现大数据的共享、合作和协同发展,真正实现大数据的整体效益。

参考文献:

[1]赵彦云,周芳.试论大数据时代中国政府统计改革发展新模式[J].教学与研究,2014(01).

[2]侯福忠.宏观经济统计分析在国民经济核算体系中的作用[J].现代商业,2013(15).

化学数据分析方法范文3

关键词:大数据;教学研究方法;模型

中图分类号:G640 文献标识码:A 文章编号:1002-4107(2017)08-0043-03

目前,国内外对于教育教学大数据的价值都有充分的认识。国外,特别是美国在政府层面,以及高校、企业、教育者和教育教学研究者对大数据的利用都有着比较多的实践,产生出较多的已经投入使用的应用系统。而国内的教育教学研究者多停留在理论研究的层面,而实用系统,多为企业行为,如一些网站,也仅仅在局部应用上提供一些基于大数据分析的个性化服务。国内高校大数据视角下的教学研究主要是对MOOC/SPOC平台上产生数据的分析,主要关注对于在线课程的教学实施提供帮助。利用教育教学大数据进行教师教学和学生学习两个方面的线上线下、全过程、全方位的支持和服务的研究,还正在起步阶段。

国内外对于大数据视角下教学研究方法的讨论较少,特别是新视角下教学研究的一般过程、规律和方法的涉及较少。长期以来,教学方法的研究得到教育教学工作者的普遍关注,产生了大量的教学法和教育教学技术,也形成了专门的学科――教育技术。但是对于教学研究方法论的关注不够,多数教学研究还只是停留在经验总结和实验实证研究层面。随着大数据时代的计算机互联网技术、数据采集及处理技术、分析方法的发展和进步,教学模式的变革、大数据视角下的教学研究的方法论研究越来越得到关注。笔者试图将视角放在大数据之下,探索这一新视角下的教学研究的新方法、新范式,发现教学研究的一般性过程和规律,建立教学研究方法模型,用于指导教学研究,从而最终在教学中发挥科学方法和技术手段的优势。

一、国内外对于教育教学大数据的应用综述

(一)国外利用大数据进行学习过程和行为分析,学习评价、学习干预、学习引导和学习成绩预测,设计学习自适应系统

国外的学者已经通过对学生的在线课程资料阅读、作业提交、学生之间的沟通交流、考试测验成绩等过程进行数据采集和分析,对学生的不良学习成绩表现给予干预性指导,从而有效、高效地改善学生的出勤率、辍学率等,提高学习成绩,改进教学。如,美国Harford和MIT对EDX平台上产生的大数据进行分析,研究世界各国学习者的行为模式,增加了行为评价和学习诱导的成分,以便打造更好的在线平台;美国DreamBox Learning公司和Knewton公司,已经成功设计了利用大数据的自适应学习系统,旨在为学生提供个性化学习服务;美国McGraw-Hill公司、英国的Pearson集团共同开发的“课程精灵”系统,能够跟踪学生的学业进展,并显示学生的学习参与度和学习成绩等大量的数据信息;加拿大的Desire2Learn公司面向高等教育领域的学生推出“学生成功系统”,系统地分析每个学生的在线学习数据,从而及时诊断学习问题,提出改进建议,并预测学生的期末考试成绩;等等[1]。

美国教育部在《通过教育数据挖掘和学习分析促进教与学》的简报中指出,大数据在教育领域的应用主要体现在两个方面:学习分析(LA,Learning Analytics,以下简称LA)和教育数据挖掘(EDM,Educational Data Mining,以下简称EDM)。EDM的目的是研究和利用统计学、机器学习和数据挖掘方法来分析教和学的过程中产生的数据;LA的目的是理解和优化学习以及学习情境,其中一个重要应用是监测和预测学生的学习成绩,及时发现潜在的问题,并据此做出干预以预防学生在某一科目或课程学习中产生风险。国外学者对于大数据在教育领域的研究几乎侧重于这两个方面的研究[2]。应用LA 和EDM数据分析结果,教师可以更好地了解学生、理解和观测学生的学习过程、发现最合适的教学方法和顺序,及时发现问题并进行干预,以提供个性化的学习服务[3]。

(二)国内集中在在线教育网站或所有引擎网站为学习者或用户提供个性化W习指导和个性化需求服务方面

相比而言,国内的研究者针对大数据在教育领域中的应用研究相对少些。少数学者从理论层面进行了大数据学习分析在考试评价、促进高校教师专业发展等方面的研究。部分从事在线教育的网站利用大数据,跟踪学生的学习轨迹,为学习者提供个性化学习方案、个性化考试指导,报告学习问题、学习能力的增长、学习状况的预警等。一些搜索引擎网站利用对搜索数据的分析,利用大数据与自然语言算法将搜索数据与个性化需求相匹配,为用户提供个性化帮助,如高考估分、专业选择和学校报考。一些国内著名高校,如清华大学,它利用在MOOC/SPOC教学中产生的数据,对其进行分析,从而对在线课程内容、顺序、进度进行改进,为学生提供更好的学习体验和服务[4]。

二、教学研究方法模型构建视点和依据

(一)模型构建的视点

1.时代特征在教育教学领域的投影带来教学和教

学研究实践的变革。大数据时代的突出表现之一是对思维方式和工作方式的重大变革,带来了在教育教学研究领域的思维方式和研究方式、方法的变革。大数据时代:(1)研究事物的全面性,即非采样性的全面数据模式;(2)研究事物之间的关联关系而非因果关系;(3)数据的价值在于利用和创新等思维方式和工作方式在教育教学研究领域带来的变革主要体现在:教学研究不再仅仅是经验的总结和体验的提炼,而是在采集到所有教与学数据的前提下,进行数据分析和挖掘,找出学生学习过程、行为、习惯的特征,发现规律和联系,使教学和教学研究趋向量化、科学化和智慧化。

2.在教学和教学研究实践中,关注和重新认知大数据的价值。根据IBM、Gartner等定义的大数据一般具有4V特征,包括数据体量大(Volume)、数据种类繁多 (Variety)、实时性强所要求的处理速度快 (Velocity)和数据提纯后的价值高 (Value)。随着互联网技术、移动技术、传感器技术等的不断发展,MOOC、SPOC、微课等在线课程在教学中发挥着越来越大的作用,在教与学的过程中产生出越来越多的教育教学大数据,这些数据除了量大之外,种类也多,有传统方式产生的传统学习数据,如考勤数据、测验数据、作业数据、考试成绩数据等也有利用网络平台或移动互联技术自动采集的学生学习观看视频、课件等学习资料的时间、时长、频数数据;学生检索和浏览主题或页面的数据;学生交流讨论、分享等日志、Wiki、讨论区记录数据等。而这些数据所具有的潜在的“大价值”正是教育教学工作者在教学研究中建立数据意识的意义。

大数据促进信息化教学变革,产生出新的资源观、教学观和教师发展观。教学资源向学习资源转变,MOOC、SPOC、微课和翻转课堂使教育教学信息化前移,教师信息素养的要求进一步提高,教学研究中科学方法和数据分析技术得到更多的运用。

与“教育教学+大数据”不同,“大数据+教育教学”是从根本上改变传统教学研究观念和模式,并充分认识和利用数据价值服务于教育教学,这正是构建教学研究方法模型的基本视点。

(二)模型构建的理论依据

教学研究通常是以教学问题为研究对象,运用科学的理论和方法,有目的、有意识地对教学领域中的现象进行研究,以探索和认识教学规律,提高教学质量。19世纪末出现了“教学是一种艺术还是一种科学”的争论。前者认为教学是一种教师个性化的、没有“公共方法”的行为;后者认为教学不仅有科学的基础,而且还可以用科学的方法来研究。20世纪上半叶西方出现了教学科学化运动,产生了后来著名的“教学有效性理论”。在教学研究理论的发展过程中,无论是巴班斯基的教学过程最优化理论,还是奥苏贝尔的有意义接受学习理论,都与教学有效性理论有着密切的关系和相关的阐述。教学有效性理论所倡导的教学科学化,教学研究的目的要改进学生的学习方式和方法、促进学生有效学习的观点,正是大数据视角下进行教学研究所秉承的思想方法和目的。

(三)模型构建的应用价值

随着国内外高校基于网络平台和在线课程管理系统开展教学活动越来越普遍,MOOC和SPOC理念下的教学研究和教学实践正在蓬勃开展。在此条件和环境下,教学中产生和采集大数据成为可能,教师充分有效地利用这些数据也成为目前迫切要探索和实践的。利用哪些数据、怎样获取和利用、利用效果评价等问题的解决是大数据视角下教学研究的任务,也是这类教学研究方法论要研究和解决的问题。

三、教学研究方法模型的关键问题

模型本身就是对某个实际问题或客观事物、规律进行抽象的形式化表达。大数据视角下的教学研究方法模型就是用形式化方法,抽象表达大数据观念下的、以教学有效性理论为指导的教学研究方法。故该模型要描述的关键问题包括如下几个方面。

1.面向数据处理及应用问题的研究维度,包括数

据、操作、过程和应用四个维度。

2.面向科学化方法的科学体系问题的研究体系,包括主题、研究方法、研究框架、研究指标和人员结构。

3.面向大数据处理和应用的复杂性问题的研究保

障,包括政策保障、人员保障、技术保障、软/硬件保障和时间保障。

四、大数据视角下的教学研究方法模型

(一)研究维度

多个维度描述教学研究过程中的数据支持。数据维度为数据种类,如使用传统方式收集的传统数据,如学生和教师的基本数据、学生作业测验考试数据、问卷调查数据等;大数据,特指使用网络教学平台或其他交互式交流讨论平台自动采集的数据;元数据,即描述数据的数据,对研究系统中的数据的含义、特征、指标、取值范围、有效性、处理和应用方法等进行描述的数据。操作维度主要描述整个数据处理过程及其各处理阶段的技术和工具,包括数据的采集、集成、清洗、表示和存储,结构化数据、非结构化与半结构化数据的表示和存储,多种采集方式下、不同格式的数据集成,冗余、缺失和噪声数据的处理等;面向主题的数据仓库的设计和实现,数据分析和挖掘结果的利用方式,如学习内容的选取和推送,学习途径的设计、学习模型的建立等。过程维度主要描述大数据视角下的研究过程,可以从个别一般个别的归纳演绎的过程入手。可从具体课程入手,研究其特点、一般过程、规律、环境等,在大数据视角下,研究开展教学研究的方法,找到一般性规律和过程,形成教学研究范式或模型。在将该模型用于教学研究工作中,并将教学研究结果应用于具体课程的教学实践中,评价验证模型。应用维度的应用目的很大程度体现了大数据的应用价值,包括学生学习行为和过程的可视化、学习成绩预测、学习干预和指导、学生学习的个性化服务以及评估等。

(二)研究体系

科学化教学研究体系的要素,包括问题边界明确的研究主题,规范化和系统化的研究方法、自然科学研究模式下的研究框架和研究指标以及人员结构[5]。其中自然科学研究模式主要对各种事实和现象进行观察、分类、归纳、演绎、分析、推理、计算和实验,从而发现规律, 并对各种定量规律予以验证和公式化。在人员结构中除了学生和教育工作者外,数据工程师在整个研究体系中也扮演着重要角色。

(三)研究保障

大数据视野下的教学研究因其内容和过程的复杂性,使得研究保障尤为重要。为了保证教学研究的顺利开展,从政策层面到具体的技术层面,以及支撑的软硬件条件和人员配备,都需要有严格的要求。

五、教学研究方法模型的应用评估

(一)模型的应用

在研究保障具备的情况下,选择具体课程或教学活动,确定研究主题,在一定的研究框架下,在研究方法的指导下,选取和应用操作技术和方法,获取各类数据,依照研究过程,获取符合研究指标的研究成果,包括分析数据、模型、模式、报告等。围绕应用目的,依据一定的应用方法在设定的时空下,应用于研究对象,获得用评价。

(二)模型的评估

它可以从两个方面评估模型――定性评估和量化评估。

1.定性评估。在应用评价中,可调查研究者(教育工作者)和研究对象(学生或受教育者)对模型应用的主观感受,来进行质性分析和评估。研究者深入教学活动,而不是人为设定的实验环境,充分地收集资料,对各种教学和学习表现进行整体性的研究,与研究对象进行实际互动,对资料进行归纳分析,通过理解他们的行为,得出模型的有效程度、可信程度、可推广程度等定性结论。

2.量化评估。依据研究指标的量化以及应用评价的量化结果,通过对数据的特征、数据之间的关系、数据的变化趋势等进行分析,从而对模型进行量化评估。

六、结语

把握时代脉搏,建立大数据意识,转变教学研究观念,改革教学研究方法,使教学研究更趋于科学化、规范化和系统化,指导和规范符合时代要求的教学研究,是建立大数据视角下的教学研究方法模型的目的。使用大数据视角下的教学研究方法模型,利用多种数据采集、处理、分析和挖掘技术,开展教学研究工作,为学生提供个性化教学服务、指导和干预学生的学习过程、科学评价学生的学习行为和预测学习成绩,体现建立大数据视角下的教学研究方法模型的价值。模型仅为概念模型,根据具体的问题,还需进一步具体化。

参考文献:

[1]姜强,赵蔚,王朋娇等.基于大数据的个性化自适应在线

学习分析模型及实现[J].中国电化教育,2015,(1).

[2]祝智庭,沈德梅.基于大数据的教育技术研究新范式

[J].电化教育研究,2013,(10).

[3]侯冬梅,谷雨,谷新胜.大数据在科技、教育与信息领域

的应用[J].计算机教育,2014,(1).

[4]金陵.基于大数据的教育技术研究新范式.大数据与信

息化教学变革[J].中国电化教育,2013,(10).

化学数据分析方法范文4

关键词:互联网联网 数据分析师 人才培养

互联网行业在快速发展,“互联网+”概念的提出标志着互联网已叩响“万物互联时代”的大门。在这个时代,大数据渗透于各行各业,掌握数据核心价值成为企业脱颖而出并取得胜利的法宝。越来越多的企业承认竞争优势与大数据有关,由此,数据分析师这一职业逐渐得到认可并受到追捧。世界500强企业中,有90%以上都建立了数据分析部门。在国内,已有超过56%的企业在筹备和发展大数据研究,据有关部门预测未来5年,94%的公司都将需要数据分析专业人才。数据分析师的职位需求随之不断增长,全国数据分析师的职位由2014年初的200多个职位增长到接近3000个职位。正如著名出版公司O’Reilly的创始人Tim O’Reilly断言,大数据就是下一个Intel Inside,未来属于那些能把数据转换为产品的公司和人群。

优秀的数据分析师已经成为促进各行各业发展,推动国家经济进步的重要人物。但我国针对数据分析的研究起步晚,市场巨大,职位空缺现象十分严重。因此,培养数据分析人才的项目活动应引起高度重视。

1互联网环境下的数据分析师

1.1数据分析师的定义

谈起数据分析师,很多人都认为其职位高高在上,不可企及,但实际并非如此。让我们从案例出发来探索其内在含义,数据分析最经典的案例便是“啤酒与尿布”,沃尔玛超市将Aprior算法引入Pos机数据分析发现美国年轻的父亲去超市为婴儿购买尿布的同时,往往会顺便为自己购买啤酒,这样便使尿布和啤酒这两样看似不相干的商品有了某种联系。于是,沃尔玛尝试将两种商品摆放在同一区域,进而取得了意想不到的良好销售收入。可见,数据分析是运用适当的方法对收集来的大量数据进行分析整理,筛选有价值的信息并形成相应的解决方案以帮助人们作出判断,采取适当行动的过程。

1.2数据分析师的层级分类

经对多家招聘网站数据分析师的招聘信息进行分析研究,发现目前数据分析师大体分为三个层级:传统行业的数据分析师、互联网初级数据分析师、互联网高级数据分析师。传统行业的数据分析师的主要工作是整理、处理数据,专业技能只要具备一定的数学和统计学知识储备即可;第二层级是互联网初级数据分析师,职位要求在传统数据分析师的基础上掌握少数的计算机工具譬如SPSS、SQL等,从职人员需具备一定的数据敏感度和逻辑思维能力,能够对数据源进行分析并能制作数据报表;互联网高级数据分析师是一类复合型人才,要熟悉业务环境并能与技术相结合解决企业实际问题,并掌握数据挖掘常用算法和一系列相关的分析软件,他们的工作与企业发展密切相连,拥有一名优秀的数据分析师的企业将拥有与同行业竞争的资本。

1.3数据分析师的能力需求

数据分析师的工作分为采集、存储、筛选、数据挖掘、建模分析、优化、展现、应用等一系列过程。接下来从主要步骤详细分析数据分析师的能力需求。数据挖掘过程即从海量数据中提取潜在的有价值的信息,要求数据分析师掌握一系列相关分析方法譬如聚类分析、关联分析、等并能熟练运用数据挖掘算法和相关工具;建模分析即对数据抽象组织,确定数据及相关性的过程,在此基础上要掌握譬如决策树、神经网络、K-means算法、SVM等至少一种相关算法;展现过程要求具备数据整理、数据可视化、报表制作能力,熟练应用D3、Vega实现数据可视化,并能运用R和DateWangler工具将原始数据转化为实用的格式。

2数据分析师的培养现状

2.1国外数据分析师的培养现状

在国外,无论是学术研究还是企业部门,数据分析已发展到较为成熟的地步。斯坦福大学的研究成员着手开发MEGA(现代动态网络图像分析Modern Graph Analysis for Dynamic Networks)并与多家媒体公司紧密合作,研究社交媒体中的用户行为,建立模型并探究其中的规律;哥伦比亚大学已开设了《数据科学导论》和《应用数据科学》课程,从2013年秋季起开设“数据科学专业成就认证”培训项目,并于2014年设立专业硕士学位和博士学位;华盛顿大学开设《数据科学导论》课程,并对修满数据科学相关课程学分的学生颁发数据科学证书。数据分析师在国外已引起了充分的重视,他们均衡分布在各行各业,运用掌握的专业知识并结合相关思维为自身、企业乃至社会的发展做着不小的贡献。

2.2国内数据分析师的培养现状

近年来,在国内,大数据的概念虽被媒体和行业广泛提及,但数据分析算是刚刚起步,数据分析师的培养课程未得到普及,我国目前将数据分析纳入教学体系的高校寥寥无几,开设相关课程并取得一定成果的有:香港中文大学设立“数据科学商业统计科学”硕士学位;复旦大学开设数据科学讨论班,于2010年开始招收数据科学博士研究生;北京航空航天大学设立大数据工程硕士学位;中国人民大学统计学院开设数据分析方向应用统计硕士。

和国外相比,我国数据分析师的人才培养机制还未成熟,高校教育仍存在各种各样的问题,譬如,大学生虽然从多门课程中接触到与数据分析相关内容,但各门课程的教学资源未能实现有效的整合。互联网环境下,大数据带来的是一场革命性的变化,若想把握机遇,实现国家经济革命性发展,首要任务就是数据分析师的培养。

3如何成为优秀的数据分析师

数据分析师作为新时代新兴起的高薪职业,对人员的能力要求是相当高的,下面将根据数据分析师的定义、能力需求并结合互联网环境的时代背景,对数据分析师的成才途径作出详细的分析。

思维变革,数据分析师成才的前提。首先要在思维方面有所改变,培养自身数据思维、多模式思维、逻辑思维和结构化思维。数据思维即量化思维,对数据具有独特的敏感度,相信一切事物皆可量化;多模式思维即构造多种想法和解决思路,拓宽思维,从多角度出发,以寻求最优的解决问题的方案;逻辑思维,在错综复杂的海量数据中要有缜密的思维和清晰的逻辑推理能力才能按照自己既定的目标有效解决问题;结构化思维即系统性思考问题,深入分析内在原因,能够制定系统可行的解决方案。

技能变革,数据分析师成才的工具。作为一名优秀的数据分析师若想在互联网环境下对海量数据进行有效的管理,就要努力学习相关的专业技能。要掌握多种机器学习方法,不断学习相关软件应用,譬如,Java、Python、SQL、Hadoop、R等等,这将成为数据分析全过程的辅助工具;除此,还要掌握一定的心理学知识,能够很好的分析和解释客户行为;在此基础上,最核心的是要掌握一定的业务能力和管理能力。

素质变革,数据分析师成才的保证。在个人素质方面,互联网时代对数据分析师的要求增多,若想成为优秀的数据分析师就应不断学习完善以下素质能力:对工作的态度严谨认真,对数据的变化时刻保持敏锐的洞察力,对方法的运用保持一定的创新性,对团队保持团结合作之心,能与顾客沟通交流并及时了解他们的需求。

实践,数据分析师成才的推动力。数据分析师的职责是帮助企业挖掘市场价值、发现机遇、准确进行市场定位并从海量数据中找出问题,提出解决方案。因此,在数据分析师的成才道路上,实践是必不可少的。相关人员要在掌握理论的基础上,敢于应用于实践,充分考虑数据中存在的价值和风险。使自我能力在实践中不断改进和完善。

4给我国高校的建议

高校为数据分析师的成长提供指导和途径,肩负着为我国社会培养有用人才的重任,因此高校要努力构建数据分析师的人才培养机制,不断输出数据分析相关人才。

高校的首要任务是,强化师资力量,改进教学方法。各大高校应联合共建优秀师资团队,鼓励教师考取数据分析师资格证,并到实际企业中进行历练。再者,我们要组建专门师资团队到国外开展学习工作,取其精髓,去其槽粕,不断优化我国数据分析师的培养体系。

第二、培养专业化的人才就要有效整合各门课程的教学资源,构建系统性教学结构。鉴于市场对数据分析师的需求的火热程度,高校完全可以开设专门课程,将与数据相关的课程进行有机的整合并开设数据分析导论、基础等课程,制定数据分析系统性课程体系,专门为市场培养数据分析的专业人才。

第三、在具备优秀的师资力量和良好的教学体系的基础上,高校也高度应注重学生兴趣的培养。数据分析师是新时代的复合型人才,一名优秀的数据分析师需掌握包括数学、统计学、运筹学、社会学、管理学以及大量软件应用在内的大量相关知识,学习过程会十分繁琐、复杂,学习周期长,学习难度大,所以建议各大高校在制定教学体系时应合理安排课程,在教学过程中应注重课程的趣味性,寓教于乐,采用案例导入、项目教学等教学方法,逐渐培养学生对数据分析浓厚的兴趣。

第四、随时更新教学数据,培养适应时展的人才。基于大数据的4V特征即大量化(Volume)、多样化(Variety)、快速化(Velocity)、价值化(Value),在培养数据分析人才的期间,高校一方面要注重数据的全面性,另一方面要注重数据的更新,及时更改教学方法和教学案例,与时俱进。高校要充分利用互联网的优势,引入MOOC(Massive Open Online Course,大规模网络开放课程)教学方式,充分发挥大数据在教育领域的作用,克服传统教学方法资源少、反馈慢、综合分析困难等缺点,将数据分析的研究成果应用于数据分析人才的培养,实现数据分析行业的良性循环。

第五、注重理论与实践相结合,努力为学生搭建实践的平台。高校可考虑校企合作的教学理念,边教学边实践,让学生将所学到的理论知识转化为实际应用,一方面在实践中巩固并检验自己的理论知识,另一方面数据来源真正的企业运营中,让学生切实体验数据的作用和风险,有助于塑造真正对企业有用的人才。

5结语

综上所述,互联网带来了全球范围的数据信息大爆炸,这对企业来说是机遇同时也是挑战,能将大数据为自己所用,是企业取胜的关键,因此数据分析师逐渐被各行各业认可。文章从数据分析师的定义出发,结合目前的时代背景,对数据分析师的每一工作步骤所需的能力进行研究,旨在初步探索优秀数据分析师的成才之道,为即将成为数据分析师的学者提供一定的理论参考。最后,针对如何构建数据分析人才培养体系,对我国高校提出了几点建议。高校的培养只是为数据分析师提供成才的途径,如何成为资深的数据分析师还有赖于每个学者的不断探索和研究。

参考文献:

[1]张明元.数据分析师的职业是否高不可及[J].出国与就业,2007(08):56.

[2]郑葵,马涛.经管类专业大学生数据分析能力提升策略探讨[J].商业经济,2013(19):52-53.

[3]冯海超.大数据时代正式到来[J].互联网周刊,2012(24):36-38.

[4]谭立云,李强丽,李慧.大数据时代数据分析人才培养的思考及对策[J].科技论坛,2015.

[5]尹颖尧,李鸿琳.赶紧培养数据分析师[J].大学生,2013(18):78-79.

[6]程征.提升数字阅读质感的数据分析师[J].中国记者,2013(6):46-47.

[7]张文霖.数据分析师那些事[J].统计论坛,2013(7):44-45.

化学数据分析方法范文5

基于理念分析和比较研究方法,对大数据的分析方法和传统统计学分析方法的关联性和差异进行了对比分析,从方法的基本思想、量化形式、数据来源、分析范式、分析方法、分析视角等角度揭示了两种社会科学分析方法存在的联系与差异。

关键词:

大数据;统计学;研究方法

中图分类号:

F27

文献标识码:A

文章编号:16723198(2015)11005201

随着信息技术的日益发展与普及,信息以及数据在社会经济发展过程中发挥的作用越来越重要。现如今,“大数据”时代已经来临,于是如何更有效地利用数据快速做出科学决策也已成为众多企业甚至是国家所共同关注的焦点问题。在数据处理和分析方法方面,《统计学》以及在其基础上发展而来的实证统计方法是当前的主流,这些方法可以帮助数据持有者从大量的数据中挖掘有价值的信息,并为其相关决策提供理论支撑和方法支持。然而,传统的实证统计方法在最新出现的大数据情境下,却呈现出了诸多缺陷,例如传统数据收集方法无法实现大规模(甚至是总体)数据的收集,传统统计方法和分析软件无法处理大规模数据,等等。于是,在将传统统计学方法应用于最新的大数据情境和问题之前,需要首先明确大数据所要求的处理方法与传统的统计学处理方法存在哪些关联和区别,然后才能够决定是否可以应用既有统计学理论和方法来处理某些大数据问题。

1大数据的界定

根据一位美国学者的研究,大数据可以被定义为:it means data that’s too big, too fast, or too hard for existing tools to process。也就是说,该学者认为:在关于大数据的所有定义中,他倾向于将之定义为那类“太大”、“太快”,或现存工具“太难”处理的数据。一般而言,大数据的特征可以概括为四个V:一是量大(Volume);二是流动性大(Velocity),典型的如微博;三是种类多(Variety),多样性,有结构化数据,也有半结构化和非结构化数据;四是价值大(Value),这些大规模数据可以为持有企业或者组织创造出巨大的商业或社会价值。

Victor在其最新著作《大数据时代――生活、工作与思维的大变革》中指出,大数据时代,思维方式要发生3个变革:第一,要分析与事物相关的所有数据,而不是依靠分析少量数据样本;要总体,不要样本。第二,要乐于接受数据的纷繁复杂,而不再追求精确性。第三,不再探求难以捉摸的因果关系,应该更加注重相关关系。这些变革反映出了大数据处理方式与传统统计学分析方法的很多关联以及主要不同。因此,下面我们分别针对两者的联系和区别进行讨论。

2大数据与统计学分析方法的联系

从18世纪中叶至今,统计学已经经历了两百多年的发展历程,不论是基础理论还是社会应用都极其坚实而丰富。大数据作为一种新兴的事物规律认知和挖掘思维,也将会对人类的价值体系、知识体系和生活方式产生重要影响,甚至引发重大改变。作为两种认知世界和事物规律的基本方法,它们在以下两个方面存在紧密关联。

(1)挖掘事物规律的基本思想一致。统计学(statistics)探索事物规律的基本方法是:通过利用概率论建立数学模型,收集所观察系统的数据,进行量化分析和总结,做出推断和预测,为相关决策提供依据和参考。对于大数据,维克托指出,大数据思维的来临使人类第一次有机会和条件,在非常多的领域和非常深入的层次获得和使用全面数据、完整数据和系统数据,深入探索现实世界的规律,获取过去不可能获取的知识。通过这两个定义可以看出,不论是传统的统计学方法还是新兴的大数据分析方法,都是以数据为基础来揭示事物特征以及发展趋势的。

(2)均采用量化分析方式。大数据分析的基础是数据化,也就是一种把各种各样现象转变为可制表分析的量化形式的过程。不论是传统统计学中所应用的数据(定性和定量数据),还是大数据时代即将被转化和采用其他形式数据(如文字、图像等),最终都是通过量化分析方法来揭示数据中所蕴含的事物特征与发展趋势。

3大数据与统计学分析方法的区别

(1)基础数据不同。在大数据时代,我们可以获得和分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机抽样。这意味着,与传统统计学数据相比,大数据不仅规模大,变化速度快,而且数据来源、类型、收集方法都有根本性变化。

①在数据来源方面,在大数据背景下,我们需要的纷繁多样的数据可以分布于全球多个服务器上,因此我们可以获得体量巨大的数据,甚至是关于总体的所有数据。而统计学中的数据多是经由抽样调查而获得的局部数据,因此我们能够掌握的事“小数据量”。这种情况下,因为需要分析的数据很少,所以必须尽可能精确的量化我们的数据。综上,大数据情况下,分析人员可以拥有大量数据,因而不需要对一个现象刨根问底,只需要掌握事物大体的发展方向即可;然而传统的小数据情况下则需要十分注意所获得数据的精确度。

②在数据类型与收集方面,在既往模式下,数据的收集是耗时且耗力的,大数据时代所提出的“数据化”方式,将使得对所需数据的收集变得更加容易和高效。除了传统的数字化数据,就连图像、方位、文本的字、词、句、段落等等,世间万物都可以成为大数据范畴下的数据。届时,一切自然或者社会现象的事件都可以被转化为数据,我们会意识到本质上整个世界都是由信息构成的。

(2)分析范式不同。在小数据时代,我们往往是假想世界是如何运行的,然后通过收集和分析数据来验证这种假想。也就是说,传统统计实证分析的基本范式为:(基于文献)提出理论假设-收集相关数据并进行统计分析-验证理论假设的真伪。然而,在不久的将来,我们将会在大数据背景下探索世界,不再受限制于传统的思维模式和特定领域里隐含的固有偏见,我们对事物的研究始于数据,并可以发现以前不曾发现的联系。换言之,大数据背景下,探索事物规律的范式可以概括为:数据观察与收集――数据分析――描述事物特征/关系。

(3)数据分析方法不同。传统统计学主要是基于样本的“推断分析”,而大数据情境下则是基于总体数据的“实际分析”,即直接得出总体特征,并可以分析出这些特征出现的概率。

(4)分析视角不同。传统的实证统计意在弄清事物之间的内在联系和作用机制,但大数据思维模式认为因果关系是没有办法验证的,因此需要关注的是事物之间的相关关系。大数据并没有改变因果关系,但使因果关系变得意义不大,因而大数据的思维是告诉我们“是什么”而不是“为什么”。换言之,大数据思维认为相关关系尽管不能准确地告知我们某事件为何会发生,但是它会提醒我们这件事情正在发生,因此相关关系的发现就可以产生经济和社会价值了。

4结语

综上,相对于传统而言,大数据思维主要包括三个重大转变。首先,要分析与某事物相关的所有数据,而不是依靠分析捎来能够的数据样本;其次,研究人员应乐于接受数据的纷繁复杂,而不再追求精确性;最后,认知世界的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的相关关系。以上三个转变构成了大数据思维的核心。在统计学的进一步应用和发展完善过程中,需要结合以上转变所产生的挑战,思考有效的统计学发展对策。

参考文献

[1]孟小峰,慈祥.大数据管理:概念,技术与挑战[J].计算机研究与发展,2013,50(1):146169.

化学数据分析方法范文6

【关键词】质量控制;化学分析;准确性;可靠性

化学分析质量控制是一个复杂的系统工程,化学分析检验工作通常都是在实验室进行的,因此实验室进行化学分析试验不仅要做好科学的管理制度,还要完善工作环境,更新工作设备和器械、提高工作人员的综合素质和技能水准,更要重视质量控制对结果准确性和可靠性的影响。

1.化学分析检测数据质量控制概述

化学成分是决定材料性能的关键性因素之一,材料中各组成化学成分含量的测定主要依赖于化学分析。化学分析结果对于材料的认识有着重要的意义,是评价材料性能、判断材料质量的主要依据。在化学分析工作中,质量控制不仅是一项技术工作,也是一项实验室管理和控制工作。在目前的化学分析质量控制中,对分析结果造成影响的因素主要有人为因素、机械设备因素、材料因素、管理控制方法因素、测定因素和环境因素六个方面。

2.化学分析概念

化学分析数据的准确性与可靠性是试验的核心,在工作中一旦出现化学检验数据失真或者错误,可能造成评价结果的事物和产品质量的影响,同时也说明在工作中管理制度和科学管理的失控,最终形成整个分析系统和分析工作的失败。如果一个试验连最起码的准确性都无法保障,那么这样的试验也就失去了意义,试验结果和数据分析也就失去了价值。

2.1准确性

取决于现场人员的职责和技能、样品的采集、保存与运输的技术和措施。如果采集的样品不具有代表性及真实性或采集的样品不能保证质量,就会造成检验结果数据失控。因此,检验结果的误差越大,造成的危害也就越大。

2.2可靠性

可靠性:可靠性取决于检验人员自身分析业务技术水平,实验室仪器设备的灵敏度、精确度,实验方法的可靠性、准确性,因此,数据的真实性及可靠性取决于分析结果和分析技术的应用环节。只有抓好试验的可靠性,才能让试验获得准确的数据,才可以进一步为材料的分析提供可靠的支持。

2.3质量保证系统

质量保证系统是在影响数据有效性的各个方面采取一系列的有效措施,将误差控制在一定的允许范围内,是一个对整个分析过程的全面质量管理体系。它包括了保证分析数据正确可靠的全部活动和措施。

3.关于化学分析质量控制面临的问题

(1)分析结果的精密度与待测物质的浓度水平有关,应取两个或两个以上不同浓度水平的样品进行分析方法精密度的检查,通过不同浓度样品的测试,进行对比分析才能让数据更精准,材料的特性才能更好的体现。

(2)精密度会因测定实验条件的改变而变动,最好将组成固定样品分为若干批分散在适当长的时期内进行分析,检查精密度。

(3)要有足够的测定次数,足够的次数是对误操作或者特例性的一种排除,尽量消除因误操作或者试验中的特异性带来的误差,让试验结果更准确。

(4)以分析标准溶液的办法了解方法精密度,与分析实际样品的精密度存在一定的差异。

(5)准确度高的数据必须具有高的精密度,精密度高的数据不一定准确度高。用不同分析方法测定同一样品时,所得出结果的吻合程度。使用不同标准分析方法测定标准样品得出的数据应具有良好的可比性。要求各实验室之间对同一样品的分析结果应相互可比。要求每个实验室对同一样品的分析结果应达到相关项目之间的数据可比。相同项目在没有特殊情况时,历年同期的数据也是可比的。在此基础上,还应通过标准物质的量值传递与溯源,以实现国际间、行业间的数据一致、可比,以及大的环境区域之间、不同时间之间分析数据的可比。

4.分析方法的可靠性

4.1灵敏度

单位浓度或单位量待测物质变化所产生的响应量的变化程度(响应大小)。A=kc+a检出限:在给定的置信度内可从样品中检出待测物质的最小浓度或最小量,高于空白值。仪器检出限:产生的信号比仪器信噪比大3倍待测物质的浓度,不同仪器检出限定义有所差别。

方法检出限:指当用一完整的方法,在99%置信度内,产生的信号不同于空白中被测物质的浓度。测定限:测定限为定量范围的两端分别为测定上限与测定下限,随精密度要求不同而不同。测定下限:在测定误差达到要求的前提下,能准确地定量测定待测物质的最小浓度或量,称为该方法的测定下限。测定上限:在测定误差能满足预定要求的前提下,用特定方法能够准确地定量测量待测物质的最大浓度或量,称为该方法的测定上限。

4.2全面地反映了分析实验室和分析人员的水平

当样品中待测物质与空白值处于同一数量级时,空白值的大小及其波动性对样品中待测物质分析的准确度影响很大,直接关系到报出测定下限的可信程度。以引入杂质为主的空白值,其大小与波动无直接关系;以污染为主的空白值,其大小与波动的关系密切。

5.准确性

5.1分析前的质量的保证与质量控制

采样的质量保证包括:采样、样品处理、样品运输和样品储存的质量控制。要确保采集的样品在空间与时间上具有合理性和代表性,符合真实情况。采样过程质量保证最根本的是保证样品真实性,既满足时空要求,又保证样品在分析之前不发生物理化学性质的变化。采样过程质量保证的基本要求。应具有有关的样品采集的文件化程序和相应的统计技术。要切实加强采样技术管理,严格执行样品采集规范和统一的采样方法。应建立并保证切实贯彻执行的有关样品采集管理的规章制度。采样人员切实掌握和熟练运用采样技术、样品保存、处理和贮运等技术,保证采样质量。建立采样质量保证责任制度和措施,确保样品不变质,不损坏,不混淆,保证其真实、可靠、准确和有代表性。

5.2采样过程质量保证的控制措施

质量保证一般采用现场空白、运输空白、现场平行样和现场加标样或质控样及设备、材料空白等方法对采样进行跟踪控制。现场采样质量保证作为质量保证的一部分,它与实验室分析和数据管理质量保证一起,共同确保分析数据具有一定的可信度。现场加标样或质控样的数量,一般控制在样品总量的10%左右,但每批样品不少于2个。设备、材料空白是指用纯水浸泡采样设备及材料作为样品,这些空白用来检验采样设备、材料的沾污状况。