数据分析论文范例

数据分析论文

数据分析论文范文1

在我国企业物流管理系统中,信息检索模型的工作机制是将工作人员的证件号码输入到信息查询系统中,确认登录到查询系统中后,在信息检索文本框中输入需要检索的内容,例如货物单号、所属部门、发送地、目的地、联系人电话等信息。在输入完查询信息后,系统会将用户输入的信息送入后台服务器中的数据库管理系统中,进行信息的比对、筛选以及查询结果的反馈,并将结果显示到前端显示窗口

2.物流管理信息检索的问题

目前我国企业多数采用的物流管理信息检索模型查询过程花费时间较长,占用数据库资源比较多,具体原因如下:

2.1数据库记录数据量问题

随着企业的发展,越来越多的企业数据被录入到数据库中,数据库也随着每天的物流业务增加而急剧膨胀。一些大的企业,由于业务繁忙,每天物流信息非常大,单位的物流管理系统中信息的数据甚至超过了上千万条,可谓海量存储。因此,信息查询系统很难实现货物信息的快速查询。因此实现快速地从这些超大容量的数据库中提取数据(查询)、分析、统计以及提取数据后进行数据显示已成为企业物流管理系统管理员和数据库管理员亟待解决的难题。

2.2每个企业使用的检索方式不同

由于各个数据库数字资源描述和表达方式的不同,导致了检索途径和方法的不同,再加上使用不同的检索软件而造成的数据库检索接口不同,风格迥异,同样的查询题目,职工需要频繁登录与退出各个数据库,在不同的数据系统中重复输入检索词,重复查找。在这过程中,职工查找货物的信息时,涵盖该主题的数据库,选择了数据库以后,还要逐个熟悉各个数据库的检索规则和用户界面等。这些无疑都会增加读者检索的时间,降低了其检索效率。读者数量比较多的时候,还可能造成系统端口的堵塞,降低数据库的访问效率。

3.基于数据前端分析的信息检索模型

数据前端分析检索,是指对在软件界面中输入的数据信息进行先期处理,便于后期在数据库查询时进行不必要的资源占用。本文通过对企业物流管理系统进行信息查询深入调查时,发现检索的内容多为货物的运送状况,例如,现在所处位置,对方是否发货,对方是否收货等信息,因此,我们可以根据货物发送货物的出发地和目的地范围,对检索信息进行分类。例如某批货物是在省内进行运输,那么通过前台信息的输入确认,可以在数据库中查询时,将检索的货物名称在省内数据区域进行查询。

4.检索系统的实现

数据前端分析的物流管理信息检索模型设计采用JAVA语言进行设计,JAVA语言是一种安全的、稳定的、简单的、由C和C++衍生出来的面向对象的编程语言,通过它的强大功能和兼容性,对物流管理信息系统进行开发。后台数据库服务器采用ORACLE10g,ORACLE全名ORACLEDataBase,是甲骨文公司的一款关系数据库,目前在软件开发市场占据主要份额。通过功能强大的JAVA语言和功能丰富的ORACLE10g数据库,研发出一款专业的关于物流管理系统信息系统的检索模型。

5结论

数据分析论文范文2

关键词:大数据技术;VOSviewer;热点研究;高被引论文;数据安全

引言

大数据这一科技术语并不是近几年才出现的。2008年9月,Nature杂志推出Bigdata:ThenextGoogle专刊,讨论大数据技术用于处理未来可能会遇到的问题,其中便首次使用了“大数据”的说法[1]。而首次提出大数据的定义是在2011年,麦肯锡全球研究院(MGI)在其的《大数据:创新、竞争和生产力的下一个前沿领域》(Bigdata,Thenextfrontierforinnovation,competition,andpro-ductivity)研究报告中清晰表述:大数据是指其大小超出了常规数据库工具获取、储存、管理和分析能力的数据集[2]。随着信息和通信技术的发展,大数据不再只是一个概念,而是逐渐融入人们生产和生活的方方面面,社会呈现出万物互联的趋势。大数据技术的繁荣与各个国家的政策和经济投入密切相关。2020年3月,数据首次被纳入生产要素范围,成为继土地、劳动力、资本和技术之外的第五大生产要素[3]。数字技术发展到今天,计算机算法越来越复杂、稳定和科学,数据的产生、传输和处理的方式也发生了翻天覆地的变化,深刻地影响着人们的生活方式。大数据的基础技术是基于云计算对数据进行存储、管理、挖掘和分析,核心技术包括数据采集、机器学习、数据预处理、数据库等。大数据技术意味着数字化进程的新阶段,驱动人类社会发展,推动社会生产格局的调整。《2021年IDC全球大数据支出指南V1》(IDCWorldwideBigDataandAna-lyticsSpendingGuide,2021V1)[4]中,对全球大数据市场的未来发展做出推断,称到2025年IT投资规模将得到巨幅增长,数额将超过3500亿美元,其复合增长率(CAGR)也将达到12.8%左右。IDC中国新兴科技研究组分析师王丽萌认为,随着互联网经济的升级和加速发展,政府、企业等终端用户正在广泛开展数字化转型,完善数据全生命周期管理,运用大数据分析和解决方案提升管理决策水平、改善内外部用户体验、支持创新应用,中国大数据市场支出将在五年内稳定增长。政府、企业对大数据技术投之以更多的关注。信息和数据规模增长,人们的思维方式也受到大数据技术的影响发生改变,学界也涌现出大量大数据领域的相关研究。随着国内外研究深度和广度的不断延伸,形成了复杂的研究网络,这些庞杂的文献数据信息亟需梳理和总结。知识图谱法和文献计量分析方法中的共词共现法是分析学术领域研究态势的基本方法,科技术语和高被引论文可以在一定程度上代表学科领域的研究内容,显示出该学科领域的学者对某一方向的重视程度和研究倾向。因此,本文以VOSviewer可视化软件为工具,以WebofScience核心合集检索到的大数据领域的高被引论文为数据源,构建关于大数据领域的科技术语知识图谱,然后对该领域的前沿和热点进行挖掘、分析和解读。

1数据准备

1.1数据收集

研究数据来源于2015—2021年WebofSci-ence核心合集中大数据领域的文献,通过主题字段检索,检索标题、摘要、作者关键词和KeywordsPlus,以“bigdatatechnology”作为主题词,截止到2022年4月9日,共检索出8944篇文献,为了使数据分析的结果更有意义,对这些文献进行清洗,过滤掉信函、会议摘要、综述论文、被撤回论文等无效文献,最终以7169篇文献为样本。然后根据被引频次从高到低进行排序,选取出前1000篇高被引论文。最后将这些文献数据信息以纯文本文件的格式导出,作为本文的数据源。

1.2研究方法

主要采用文献计量分析方法和知识图谱法,以WebofScience核心合集中的论文为研究对象,以大数据技术为主要研究领域,时间跨度为2015—2021年,借助科学知识图谱软件VOSviewer对从WebofScience导出的文献数据信息进行Authorkeywords和Keywordsplus共现可视化,从而确定大数据技术的研究热点,构建关键词共现矩阵,并通过呈现出的聚类谱系图、标签视图、密度视图进行聚类分析,以便直观和动态地揭示大数据技术的知识结构和演化路径,从而实现对2015—2021年大数据技术文献的前沿和热点研究。

1.3数据预处理

将1000篇高被引论文作为源数据导入VOS-viewer软件,共析出5130个关键词,关键词的选取规则为:共现次数达到5次及以上,共得到252个关键词。但是软件自动合并出的结果中存在一些未达到共现分析要求的无效关键词以及重复关键词,需要进行手动筛选。在新建txt文档中加入如下关键词处理规则:(1)去除语义过于笼统、意义过于宽泛以及无意义的词,如bigdata、things和0等;(2)统一单词单复数,如network与networks,model与models;(3)合并同义词,如:network与In-ternet,industry4与industry4.0。最终得到174个符合共现要求的关键词。

2大数据领域论文计量分析

2.1年度发文数量分析

WebofScience核心合集2015—2021年共发表了23540篇大数据相关论文,图1是2015—2021年该领域所发表的相关研究的逐年趋势。可以看出,近几年大数据相关研究文献的发表数量呈现出逐年稳定上升的趋势,学界对大数据技术的研究在7年间从每年331篇上升到2075篇。大数据相关研究论文近年来的持续增长,究其原因,主要在于大数据技术进入各行各业,从而导致全社会出现了对大数据技术的应用需求。从国家层面讲,大数据技术已经成为国家建设数字强国的强大驱动力;从企业层面而言,大数据技术在生产、传播和反馈信息方面具有突出作用;在科研领域,大量学科领域均有基于大数据技术的应用研究。除此之外,也离不开人们对数据本身的采集、管理、处理、分析等技术需求。社会生产活动需要用到大数据技术以及大数据的思维方式,因此,对大数据技术的需求与日俱增。大数据技术产生自数据库,集大成于分布式系统,现在又重新落地于数据库系统。近年来,人们不断追求和改进现有的技术,推动了对大数据技术的研究。如今新型分布式关系数据库技术和以分布式计算为特征的云计算技术将我们带入人工智能和信息化社会,大数据技术的相关研究仍在继续,在大数据领域相关研究文献数量逐年上升的大趋势和分布式计算的技术背景下,未来几年对数据库和云计算的研究将持续增长。

2.2高被引论文分析

高被引论文之所以被多次引用,一方面在于其研究具有一定的代表性,学者们普遍认可论文成果在学术领域的贡献;另一方面也和论文关注的领域发展较快有关。因此,高被引论文可以在很大程度代表人们对某一问题研究的重视程度和研究倾向。表1列出了2015—2021年WebofScience核心合集中大数据领域排名前10的高被引论文。可以看出,大数据领域的三个主要研究方向为大数据挖掘、大数据运维、云计算。2021年我国围绕大数据技术的资金投入继续增加,大数据技术在实践落地的过程中也存在风险和挑战,在数据的运营和维护过程中,如何有效地管理和应用大数据技术,以及在大数据的价值转化过程中切实保障用户数据信息的安全,也是大数据领域需要研究和解决的问题。

3大数据领域高被引论文聚类分析

3.1基于聚类谱系图的关键词共现分析

VOSviewer可以对文献知识单元进行关系构建,对数据信息进行可视化分析,从而绘制出可以展现某一领域的知识结构、演进和前沿热点的知识图谱,实现对关键词共现的聚类分析。将上述2015—2021年大数据领域高被引论文的174个关键词导出到txt文档,接着在Excel文档中整理这些关键词数据,依照出现频次重新排序,选取前20个高频关键词,得到大数据领域高被引论文关键词频次表(见表2)。VOSviewer软件可以生成聚类谱系图,将经过数据预处理的174个符合共现分析要求的关键词导入软件,设置聚类规则为最小聚类中包含的关键词不少于25个,通过统计和梳理大数据领域的高被引论文中各个关键词出现的频次,以及各个关键词之间的关联程度,以展现大数据领域的研究热点和结构分布。图2是VOSviewer对样本数据分析生成的关键词聚类谱系图,图中的结点表示在大数据领域高被引论文中共现的关键词,结点的大小表示该词共现的频次高低,结点越大,体现出其研究热度越高。图谱中有174个标签,3017条连接线,总体关联强度为6567。可以看出,2020—2021年间,大数据领域的研究形成了3个聚类,分别围绕“大数据。开发与挖掘”(红色)、“大数据分析与管理”(蓝色)、“大数据运维与云计算”(绿色)这三个技术方向进行研究。聚类一:大数据的开发与挖掘这个类簇包含73个关键词,其中系统(sys-tem)、框架(framework)、计算机应用(applications)、算法(algorithm)、模型(model)、机器学习(machinelearning)、人工神经网络(artificialneuralnetworks)这些词的结点最大,是这个聚类的中心结点。而分布式计算系统(MapReduce)、数据融合(datafu-sion)、智慧农业(smartfarming)、数字医疗保健事业(digitalhealth)、智能电网(smartgrid)、清洁生产(cleanerproduction)、碳排放(CO2emissions)等词,在该聚类的网络边缘。从图2还可以看出,系统一词的结点最大,可见对于系统的开发是大数据领域的一个研究热点。大数据挖掘技术通过建模和构造相关算法便于人们在海量数据中获取信息。其中,算法是由基本运算和规定运算顺序构成的运算规则和步骤[5]。机器学习是对计算机模拟人类神经网络和学习行为的研究,计算机可以根据算法智能地进行大数据挖掘与分析,从而构建、丰富和完善自身知识网络结构,并通过建立数据模型,实现对同类型数据的预测分析。深度学习是一种含多隐层的多层感知器,起源于机器学习,卷积神经网络属于深度学习的范畴[6]。而机器学习属于人工智能的范畴,是人工智能的一个研究分支。在大数据时代,凭借大规模的数据信息,通过构建数据模型,不断改善人工智能对数据预测的准确性,研究更加科学合理的数据挖掘算法,实现对人类神经网络的模拟,构造大数据网络体系,从而获取信息。随着在采集、挖掘过程中的数据沉淀和积累,融合了数据库技术、人工智能和机器学习的大数据挖掘技术也不断得到优化。近年来,人们越来越重视大数据技术和以大数据技术为支撑的人工智能技术。根据调查,11.1%的企业对大数据技术和人工智能技术的累计投资超过5亿美元,有84.1%的企业在大数据技术和人工智能方面已开展工作[7]。可以预见,这样的趋势在未来仍将继续。大数据技术的应用包括多个领域,如在农业、医疗保健事业和电网技术等方面的应用,此外,还可以看到,在大数据开发、大数据挖掘这两个技术方向的理论研究到技术落地的应用研究过程中,对大数据技术的清洁生产和碳排放也很关注。从大数据、大环保到大治理,大数据技术在环境管理和决策过程中发挥了越来越重要的作用。聚类二:大数据分析与管理这个类簇包含49个关键词,有大数据分析(bigdataanalysis)、工业4.0(industry4.0)、服务(service)、信息系统(informationsystems)、持续性(sustainability)、创新(innovation)、供应链管理(supplychainmanagement)等结点较大的词,还有专业化生产系统(manufacturingsystems)、数据科学(datascience)、情感分析(sentimentanalysis)、业务分析(businessanalytics)、竞争优势(competitivead-vantage)、用户认可(useracceptance)等结点较小的词。大数据分析和管理技术与工业4.0的时代背景密切相关。工业4.0时代具有智能化、个性化、虚拟与现实相融合的特征[8]。人们的需求通过在网络留下的数据信息表现出来,通过大数据整合分析,可以实现产品生产和分发的定制化。社会生产朝着个性化定制、服务性产品和数据要素驱动产业新业态和新模式创新的方向前进和发展,企业在工业4.0时代需要应用大数据分析和管理技术,绘制目标群体的用户画像,通过对数据加工、系统分析,实现从大数据到具体信息又到服务的转化,进而做出科学决策,获得企业在自己产业领域的竞争优势。此外,还有对大数据技术的绩效评估和数据管理。信息数据的生产没有尽头,但是并非所有的数据都具有信息价值,也并非所有的数据都可以实现信息到服务的价值转换,如何对数据进行科学和可持续的管理以及对未来的发展趋势进行预测,在工业4.0时代受到广泛关注。聚类三:大数据运维与云计算这个类簇包含52个关键词,其中,互联网(in-ternet)、云计算(cloudcomputing)、物联网(iot)、安全(security)、架构(architecture)、区块链技术(blockchaintechnology)、信息与通信技术(ict)是该聚类的中心结点。此外,处于网络边缘的结点主要有:数据共享(datasharing)、数据隐私(datapriva-cy)、边缘计算(edgecomputing)、雾计算(fogcom-puting)、云(cloud)、智慧城市(smartcity)等。信息网络系统与物理网络信息系统进行融合,出现物联网、工业物联网等新兴概念。社交媒体每天都制造大量的数据信息。《我们究竟产生了多少数据?》一文曾预测,到2055年全世界将产生高达175ZB的数据[9]。分布式计算使企业可以更加方便快捷地处理社交媒体上规模巨大的数据信息,通过大数据应用程序对数据进行挖掘和分析,从而绘制用户画像,提供个性化的服务和服务性产品。在碎片化信息时代,数据也是碎片式的,如何面对这些碎片式的数据构建数据模型是大数据技术发展应用的一个挑战,并且在构建数据模型的过程中,数据源并非全部真实可靠,有些信息涉及个人隐私或国家机密,难以获取完整的数据信息,因此数据质量难以保证。此外,互联网带来了数据的流动共享,人们在互联网中的所有行为都会留下数据信息印记,而数据信息的传播不再受限于空间和时间,可以大量无成本扩散,对数据的隐私保护与安全带来巨大挑战。同时,数据的流动共享还带来数据泄露的风险,无论从个人数据权利出发还是从国家数据利益出发,都需要对数据流动共享给予一定的限制。构建大数据监控报警体系,可以保证数据的可靠与安全。人们的生活与互联网的关联程度比以往更加紧密,例如以数字化为特征的智慧城市建设,实现数据信息安全是建设智慧城市的重要内容和评价标准之一。根据美国国家标准技术研究院的统计,云计算涉及的安全问题主要在虚拟机隔离、数据保护、云计算体系结构、身份访问与控制等多个方面[10]。云计算是以分布式计算为特征的技术,通过云计算,各种数据和信息可以从一台计算机提供给另一台计算机。在云计算环境中,虚拟的操作系统建立在服务器上,数据信息都储存在服务器中,比如用户上传的身份认证信息。数据信息一旦被上传到云中,用户便不再拥有对数据的控制权,一旦服务器遭到入侵,用户数据就会被盗取,从而造成数据泄露。此外,区块链技术与比特币密切相关,通过对数据的层层处理改变数据存储形式,将区块链技术应用到数据隐私保护与安全,数据在网络中的流动将会更有保障。

3.2基于标签视图的关键词演化分析

使用VOSviewer软件对2020—2021年大数据领域关键词进行演化分析,生成关键词标签视图(图3)。视图中结点的颜色表示关键词出现的平均年份,结点的大小表示关键词共现频次的高低。从2015年到2021年颜色逐渐由蓝到黄,从中可以看出大数据领域研究热点的演变。近几年大数据研究的关键词大多集中出现在2018年,有较高共现频次的关键词集中分布在2017—2018年。2015—2016年有关大数据的数量较少。由于大数据技术发展极快,相关的研究论文越来越多,到2021年大数据相关研究的论文数量从每年331篇增长至2075篇,出现的高共现频次的关键词有:系统(system)、挑战(challen-ges)、大数据分析(bigdataanalysis)、物联网(iot)、云计算(cloudcomputing)、工业4.0(industry4.0)、框架(framework)、模型(model)、算法(algorithm)、机器学习(machinelearning)、隐私(privacy)、区块链技术(blockchaintechnology)。可以看出,大数据分析、数据管理、数据模型、云计算的研究热度比较高,是大数据领域的研究热点。此外,2019—2021年间出现了边缘计算(edgecomputing)、安全(security)、数据隐私(dataprivacy)、企业绩效(firmperformance)、数字双胞胎(digitaltwin)、工业4.0(industry4.0)、人工智能(artificialintelligence)、区块链技术(block-chaintechnology)、循环经济(circulareconomy)等关键词,对大数据技术的研究更加深入,理论研究的广度和深度进一步提高,从对单一技术到技术群,再到“技术+管理”“技术+运维”,可以看出,数据安全与隐私保护方面的技术受到重视,相关技术的研究是近年来的新兴热点。

3.3基于密度视图的热力分析

关键词密度视图可以对相关领域的研究重点予以可视化。通过对2020—2021年大数据领域关键词密度视图进行热力分析,可以了解大数据领域的研究现状。如图4中,可以看出大数据分析(bigdataanalytics)、系统(system)、机器学习(machinelearning)、挑战(challenge)、物联网(iot)、工业4.0(industry4.0)、云计算(cloudcomputing)这些词的密度最高,可见大数据的开发、挖掘、分析、管理、运维与云计算这几个技术方向的研究最受学者关注。

4结语

数据分析论文范文3

1资料与方法

1.1一般资料

本刊微信公众号及官网2016年1—6月及2017年1—6月后台关于用户、图文、菜单的统计数据。

1.2方法

1.2.1收集数据

进入本刊官网数据统计后台及微信公众号后台管理账号,分别收集2016年1—6月及2017年1—6月后台统计的相关数据:一是用户分析,统计官网及公众号用户信息,包括用户的性别分布、地域分布等;二是图文分析,统计官网信息的浏览量及微信公众号推送信息的阅读量;三是菜单分析,主要统计官网栏目和公众号自定义菜单点击量。

1.2.2数据处理及分析

采用Excel表录入数据,其他结果以对比图或趋势图形式表现,进行比较分析。

2结果

2.1用户分析

2.1.1性别

官网截图显示,浏览人群性别2016年1—6月间以男性为主(51%),过后逐渐趋向于女性增多,2017年1—6月间女性占比为62%。从公众号统计结果可以看出,关注人群中女性占比在不同时间段均为最高,分别占55.00%、55.51%,相差不大。微信公众号2016年1—6月及2017年1—6月关注用户性别分布.

2.1.2地域

官网截图(见图2)显示,浏览官网地域分布中,除其他地区外,重庆市始终占据重要地位,即排名第一,四川省地位比较稳定为第3位;2个时间段的变化区别在于2016年1—6月排名第二的江苏省变为2017年1—6月间的河南省,而江苏省退居第4位。微信公众号关注人群地域分布数据中也体现这一现象,河南省排名上升至第3位。

2.2图文分析

2.2.1官网发送信息数据分析

后台数据统计显示,本刊官网2016年1—6月及2017年1—6月的信息中,均呈现同一现象:本刊相关的动态、参与学术会议报道等信息浏览量较高,且2017年网站改版后,信息浏览量飞速提升,较2016年各类型信息提高4~6倍。

2.2.2微信公众号推送图文数据分析

从后台统计数据可以看出,2016年微信公众号推送内容较少,阅读量主要集中在本刊组织策划的活动及微课堂相关通知报道,以及其他转载信息上;2017年本刊加大了专题、专家笔谈等学术论文的推送,编辑参加了很多学术会议并进行现场报道,自己策划组织活动也在增加,促使推送内容增多,阅读量加大说明读者对这些报道比较感兴趣。另外,2017年减少了本刊动态及转载内容,还推出原创文章。

2.3菜单分析

2.3.1官网栏目数据分析

后台统计数据显示,2016年1—6月官网栏目较单一,关注量最多的为编辑部风采(主要动态及公告,最高点击7842人次),其次为下载资讯栏目(主要学术会议通知及活动成果,最高点击1538人次)。2017年官网全新改版,栏目有所增加,从2016年年底开始添加内容,2017年1—6月关注最多的栏目为本刊动态及公告(最高点击量9049人次),其次为编委简介(最高点击量6224人次),最后为合作医院(最高点击量3007人次)。

2.3.2微信公众号自定义菜单数据分析

微信公众号2016年1—6月自定义菜单点击趋势见图3,公众号2017年1—6月自定义菜单点击趋势见图4。从图3、4可以看出,公众号自定义菜单在不同时间段,“在线期刊—稿件查询”点击量始终在最前面,而其他菜单点击量随着活动变化而变化,2016年本刊组织策划的“5•12活动”比较受关注,2017年对自定义菜单进行了整合调整,大家的关注点放在了“会议微课”上。

3讨论

3.1用户数据分析

(1)官网用户性别变化。6月正处于毕业季,发表毕业论文的学生中,科技学术研究男生占多数,所以在2016年1—6月间男性浏览量高于女性。2017年网站进行了改版,从视觉和色调上都做了新的尝试,更能引起女性网民的注意,也是2017年1—6月间女性浏览量高于男性的客观原因。(2)微信公众号用户性别分布。女性关注一直多于男性,这与手机微信用户女性多于男性因素有关。(3)地域分布变化。本刊2017年经河南省高级评审委员会认可,是评审发表文章的期刊之一。这也是本刊加大宣传的成效之一。同年,本刊在湖南省进行了实地考察,召开审稿会和专家座谈会,促进了宣传和学术交流。针对以上数据,因为关注人群中女性多于男性,可以尝试在微信公众号里开辟适合女性阅读的科普性与学术性相结合的栏目内容,本刊借此能够传递一种人文化关怀,即在忙碌的工作之余从生活中为广大女性医务工作者提供关爱,从而留住女性关注者。期刊还应积极策划更多学术科研类活动,针对各大医学院在校学生,邀请本刊编委或审稿专家进行论文撰写指导、临床技能、科研指导等课程培训,吸引更多男性关注者。继续加大期刊宣传力度,策划适合部分区域发展的优惠政策。编辑积极走出去,与本刊编委及审稿专家一起在意向省市开展审稿及学术交流会议或活动,借此开辟市场,让更多省市了解及关注杂志。

3.2图文数据分析

(1)官网浏览信息稳定。官网始终是期刊的形象,作者、读者在登录官网时想了解这本杂志,所以浏览量主要集中在本刊相关的动态上;随着本刊组织策划活动的增多,作者、读者对这方面的关注度也随之增长。浏览量提升4~6倍也说明期刊网站改版后提升了吸引力,策划活动和参与会议一定程度上提升了期刊的影响力,促使了更多作者、读者对期刊网站信息的点击。(2)微信公众号阅读信息变化。从之前的转发信息到本刊的实时报道,提示2017年本刊加大了宣传力度,编辑参与更多的学术会议活动并进行现场报道成效较好,推送内容增多也能引起关注,内容的时效性、新颖度很关键。同样,本刊组织策划的活动增多也促使了推送内容的丰富。另外,本刊2017年进行专题组稿,组织了多个临床研究热点专题,邀请国内各专业领域专家撰写述评,微信公众号推送杂志发表的专题论文、优秀论文,利用自媒体平台宣传专家,将学术内容与新媒体进行融合,挖掘出更大的读者市场。针对以上分析,本刊编辑应继续积极走出去,参与更多学术性会议,进行现场撰稿报道,及时展现学术会议规模,将前沿、新颖的学术知识、技术总结报道送达给各位读者,同时也给各位编辑提供了更多学习平台,建立与各专业专家交流沟通渠道。联合本刊编委及审稿专家一起,针对新颖性强、研究前沿的信息,联合推送,丰富内容,增强学术性。积极思考新媒体创新模式推送学术论文,形式多样,在传播专业学术内容的同时提升杂志影响力。策划更多具有针对性、专业性、精准性的学术活动或会议,积累更多学术资源,利用自媒体平台传播,为广大作者、读者进行服务。

数据分析论文范文4

关键词:商务经济学;商业数据分析;stata软件;学科建设;实践应用

一、引言

我校商务经济学是全国第二批批准增设的学科专业。本专业为教育部《普通高等学校本科专业目录(2012年)》中特设专业,学科门类为经济学,专业代码为020105T。截止到2019年上半年,全国已有19家高校开设了商务经济学本科专业,其中不仅有南开大学这样的综合类高校,还有兰州财经大学、哈尔滨商业大学、广西财经学院、武汉商学院等财经类院校。2015年上海商学院举全校之力成功获批开设商务经济学本科专业,经过学校近年来的大力建设和积极投入,2018年以商务经济学专业和学科为依托,获得了上海市高原学科(应用经济学学科商务经济学方向)项目的支持,同年06月经过中国商业经济学会与全国商务经济学专业学科建设研讨会一致推选我校为中国商业经济学会商务经济学委员会会长单位。我校是目前上海唯一一家开设商务经济学本科专业且获得学科类项目支持的高校,商务经济学院同时也是全国唯一以专业命名的二级学院。与全国其他十数所兄弟院校相比,上海商学院的商务经济学学科整体建设无论是在教学课程开展,人才引进、学生培养、科研平台搭建以及数据库和智库建设上都处于较为领先地位。围绕“一带一路”的国家战略,以及卓越全球城市的上海地方功能地位的要求,上海商学院商务经济学学科建设强调以商贸流通服务业为载体,不断改善上海营商环境为目标,使用大数据、互联网+和人工智能等先进方法为手段,以商务环境、商业模式和商业数据分析为发展方向,致力打造出“全国知名,上海一流”的品牌专业与学科。毫无疑问,互联网与数据分析已经进入了各行各业之中。基于此,数据在高校经管类学科和专业的教学和科研中承担的角色也越来越重要。除了高水平经管类论文包括大量的实证数据分析之外,许多高校还自主建立了大型数据库,例如北京师范大学中国收入分配研究院开展的《中国家庭收入调查》(CHIP)、中国人民大学中国调查与数据中心开展的《中国综合社会调查》(CGSS)、北京大学国家发展研究院开展的《中国健康与养老追踪调查》(CHARLS)和西南财经大学开展的《中国家庭金融调查》(CHFS)等。在教学上,培养并提高我国高校大学生数据分析能力已经成为了中国高等教育界的共识。张长亮等(2019)就从实践教学目标、实践教学内容、实践教学方式以及实践教学考核评价四个方面强调了中国高校与美国高校存在的差距,美国高校特别强调培养学生的实践能力和应用能力,因此他们认为大力发展数据素养教育正当其时[1]。在这样的背景之下,本文以上海商学院应用实践型课程———商业数据分析为例,详细描述了该课程的教学团队配备、软件使用、课程设计、数据支持以及课后激励等内容,不仅为商务经济学学科体系建设中应用实践型课程的设置提供帮助,也为国内数据分析类课程的发展提供相应的参考和补充。本文的结果表明:首先,商业数据分析的开设与本校商务经济学科商务环境、商业模式和商业大数据三个建设方向紧密结合,大力推动了整个学科体系的构成;其次,选择stata软件作为操作载体,这与学术界与数据分析工作领域所使用的软件相同,大幅度提升了老师和学生学以致用的可能性;再次,建立了具有商务经济学特色的“一带一路”沿线国家数据库,丰富了课程的数据来源并且为今后数据类工作的展开打下了扎实的基础;最后,通过“以文促教,以赛促学”激发了学生的学习热情和拓展了老师的教学内涵,同时也使得学生可以有的放矢。

二、应用实践类课程与商务经济学科建设的关系

与传统经济理论相比,实证数据分析包含大量实时性数据,通过分析这些数据可以有效地考察和探究经济主体的偏好,以及在市场中的行为。无论如何,实施实证数据分析都离不开扎实的数学和统计学基础,目前经济学界中的计量经济学已经成为了即微观经济学和宏观经济学之后,经济学又一重要的组成部分。从内容上来看,它就是通过数学和统计学的方法来描述经济变量之间的关系。应该说,计量经济学是实证数据分析的前提条件,而实证数据分析则是目前主流经济学界分析所使用的重要工具,因此作为应用经济类学科的一个门类,本校在确定商务经济学的学科方向时也将数据分析作为了其中之一。与其它行业的数据分析相比,商贸流通行业的数据分析研究可以分为两个阶段,一是通过科学的方法收集数据,并且建立有效实用的数据库;二是利用计量经济学理论配合相应的统计分析软件对收集到的数据进行分析。许多国内高校已经开设了初级、中级或者高级的计量经济学课程,这为学生进行商业数据分析打下了理论基础,但是真正要完成数据分析的全过程,单一地依靠理论是远远不够的,熟练掌握一款统计软件的应用将会给数据分析带来极大的帮助。不少高校已经认识到了这一点,例如北京理工大学在建设数据科学与大数据专业建设过程中,数据软件的应用是必修课程之一(王国仁等,2018)[2];清华大学、厦门大学、中山大学以及上海财经大学等经济学重点高校也都将stata、spss、R语言等经济类统计软件列入了教学计划之中。为了契合上海商学院商务经济学学科建设方向,并且与其它国内经济学重点高校看齐,本校也推出了基于stata软件的商业数据分析课程。该课程与传统的经济学课程相比,旨在教会学生如何将理论知识应用到统计软件之中,帮助学生进行大规模的数据分析;同时,该课程与计算机学科的课程相比,它又强调了数据分析背后的经济学逻辑和含义。商业数据恰恰具体反映了商贸流通行业中不同主体在商业交易过程中的行为信息,通过stata商业数据分析,可以让学生通过数据去验证经济理论的正确性,让学生学会使用数据来诠释经济理论,用数据来证明经济理论。从教学和科研的角度综合来看,这个课程可以被看作是整个学科体系构建中教学与科研之间的桥梁,前沿的数据分析知识可以通过它传导给学生,学生也可以将这些学到的理论知识通过软件应用到日常工作和生活之中去。而对于商务经济学学科而言,它也可以将学生对数据分析的掌握情况如实地反馈出来,帮助教师完善整个学科的发展体系。

三、基于stata软件的商业数据分析课程设计

(一)课程团队成员配备

商业数据分析课程的先导课程较多,除了有学生较为熟悉的微观和宏观经济学之外,还有较难掌握的微积分、线性代数和概率论与数理统计这三门数学课程。因此,本课程团队需要跨学科进行搭配。我院的商业数据分析课程团队由4位老师组成,他们的专业分别为数学、计量经济学、商务经济学和计算机科学。其中,数学和计量经济学的教师主要负责帮助学生夯实理论基础,让学生能够尽快掌握计量经济学所需要用到的各种数学知识,帮助学生们快速地进入到数据分析课程的状态之中。课程的主体部分则由商务经济学专业教师进行承担,与其他学科专业的老师相比,他们既要教授学生们stata软件对计量经济学理论知识的使用,最主要还是还要让学生明白统计数字和统计结果背后蕴含的商务经济学逻辑和道理。另外,计算机专业教师则主要负责解答软件操作过程中计算机代码当面的问题,并负责调试计算机运行过程的出现的一些计算机领域专业问题,配合好整个课程的实践操作过程。在学历方面,4位教师均拥有经济学、管理学或者理学博士学位,其中2位还拥有高级职称。在实践经验方面,3位教师有的拥有行业相关经验和证书,有的则拥有数据分析师称号。

(二)课程软件和教材的选取

在诸多经济学统计软件中,stata软件以其小巧的空间需求,功能繁多的统计功能,完善的中文识别以及不断更新的外部代码获得了国内大多数实证分析人员的青睐。目前,国内许多高校都购买安装了stata软件供师生使用,且聘请专业教师设置了针对stata软件的教学课程(许云,2014)[3]。上海商学院依托本校已有的一个部级实训中心,购买了正版的sta-ta13.0软件,该软件目前在实训中心的经济学综合实验室免费提供给师生使用,且分配了专门的服务器空间以保障运行速度,该实验室同时也是商务经济学院的市级商务经济研究基地的内涵内容之一。除了stata软件之外,该实验室中还囊获了R软件、spss软件、Arcgis软件等诸多实证所需软件,这些软件都免费开放给本校的师生使用。在教材方面,基于stata软件的商业数据分析课程,在理论知识方面选用了国家通用的“十二五”计量经济学教材(李子奈、潘文卿,2015)[4],在实践操作方面则主要选用《计量经济学及stata应用》这本教材(陈强,2015)[5],在授课过程之中还会穿插各类商贸流通行业和企业的数据进行课堂练习和课后操作,并且提供学生相应的数据让学生进行课堂或者课后的练习。《计量经济学及stata应用》这本教材由高等教育出版社出版是高等学校经济类核心课程教材,已经获得了学界的广泛好评。

(三)课程情况

在2017—2018第二学期全校范围内开始试点“商业数据分析”课程,这是商务经济专业最主要的实践应用型课程。该课程的授课过程主要在上海商学院现代流通部级实验教学示范中心的数据实验教室进行,授课对象是商务经济学本科班的同学,总数在65人左右,形式是多媒体授课加上机形式,老师除了在通过多媒体进行PPT演示之外,还在主机上对程序进行操作,学生在客机上观看,每一个知识点结束后,让学生根据所学知识自己处理数据。选择具有代表性的数据,让学生在课后进行实践操作,并且提交数据分析报告,要求学生不仅能够使用软件分析数据,还要他们反馈出数据中所包含的信息。经过该课程的学习,80%以上的同学取得了优良的成绩。通过两个学期的试点,商务经济专业的学生已经熟悉了实践应用型课程的上课形式,初步掌握了如何使用软件进行具体的商业数据分析的步骤,这为他们未来进行毕业论文设计,参加研究生入学考试、参加公务员选拔考试以及就业给予了一项新的技能。

(四)具有商务经济特色的数据库建设

stata软件虽然较为小巧,但是它却可以处理100G大小的大型数据。商业数据分析自然以商贸流通类数据为主,因此除了教材中配套的少量数据之外,需要教学团队进一步开发针对上海商贸流通业和商务交换领域的数据(林晚发,2017)[6]。结合国家战略和上海发展需求,上海商学院整合商务经济学院、上海发展研究院和科研部门的力量开发了一套“一带一路”产业地图数据。该数据以“一带一路”区域经济研究为出发点,以国内外成熟的经济指标数据为基础,特别突出了“一带一路”沿线国家贸易、投资和营商环境的数据收集和整理。目前该数据库中的国家数量为65个,数据更新至2017年。除了国家层面的数据之外,该数据库还提供了中国及重点省市对沿线各国的进出口和对外投资统计数据,并涵盖经济、农业、工业、环境、资源、贸易、投资等十几个领域。除了普通的商业类数据之外,上海商学院“一带一路”数据库在不久的将来会推出相关国家的投融资环境与风险分析数据库(李颖,2019)[7]。该数据库将按照板块进行划分,国别板块实时跟踪包括“一带一路”沿线国家在内的120多个国家的投融资环境与风险分析,并由学校的骨干教师和外校专家一起对各类投资项目进行财务、人员以及前景的全方位分析。研究板块主要提供国内外专家对“一带一路”倡议的最新观点,以及全球主流分析机构和权威智库对“一带一路”倡议的最新研究成果。项目板块整理并“一带一路”沿线国家的投融资项目的具体信息。该数据库给本校的商业数据类应用型课程打下了数据基础。

(五)以文促教,以赛促学

商业数据分析课程除了在教学环节给师生有一个实践操作的平台之外,还鼓励师生在科研论文写作、毕业论文写作、各类比赛申报以及各类项目申报中使用商业数据分析方法。承接该课程的商务经济学院负责人及团队成员已经带领所教班的学生,结合自身专业以及所在院系的建设要求,使用sta-ta13软件对商业模式问题展开了相应研究,并写成论文在学校上进行发表(王琳琳等,2017;李成彬等,2018,张荣佳,2019)[8-10]。与此同时,商务经济学本科学生还使用上课所学知识在2019年6月参加了首届在重庆举办的大学生“未来商务经英挑战赛”暨第二届大学生商务经济学应用分析大赛,并在全国十几支代表队的激烈竞争中获得了团体二等奖。这种“以文促教、以赛促学”充分激发了学生的学习热情和教师的科研热情。

四、结论与未来规划

如何建设应用型经济学学科是很多应用型本科高校一直思索的问题,在课程设置方面更多的开设理论与实践结合的课程势在必行。那么,对于近年来刚刚开设的商务经济学这门新兴的应用经济学学科和专业而言,搭建好完整的课程体系无疑非常的重要。本文以上海商学院商务经济学科建设过程中开设的应用实践型课程之一———商业数据分析为例,详细描述了该课程的教学团队配备、软件使用、课程设计、数据支持以及课后激励等内容,旨在通过这些内容促进国内和本校商务经济学科的全面发展。通过本文的具体阐释可以得到如下结论:首先,商业数据分析课程的开设,需要和学校商务经济学科的大方向相吻合;其次,选择一款合适通用的软件以及教材有益于增加课程的实用性和质量;再次,在数据源头上应该建设具有特色的数据库加以扶持;最后,通过“以文促教,以赛促学”等方式,可以激励学生和教师将精力更多地投入到课程之中。商务经济学本身就是一门新兴的学科,它的未来还具有较大的不确定性,不过偏向实用性发展的特点是不会改变的。应该说,我校大力支持的商业数据分析方向对整个商务经济学科的发展而言,起到了一个投石问路的效果,该课程将计算机和经济理论紧密的结合在了一起,让学生实实在在掌握了一门未来工作中可以使用的技能。该课程的设计与开发对于目前上海新商业业态层出不群的现状而言,是非常及时和必要的,对于应用型商科人才培养模式的创新与实践也带来了有益的启迪。未来商务经济学科在商贸流通产业的数据工作可以分为两个部分,一是继续收集数据,将已有数据库与其它数据库进行匹配,例如在“一带一路”数据库基础之上建立全国商贸流通数据库,该数据库将和国内广泛使用的工业企业数据库、海关数据库、国泰安上市公司数据库等相互对接,成为研究国内商贸流通重要数据库;二是使用进一步数据挖掘,并邀请企业界一线程序分析人员参与到课程教授过程之中。

参考文献:

[1]张长亮,王晨晓,李竟彤.大数据时代中美高校数据素养教育比较研究[J].情报理论与实践,2019,(8):131-137.

[2]王国仁,金福生,刘驰,王树良.面向国际化的数据科学与大数据专业课程体系建设[J].中国大学教学,2018,(12):43-45.

[3]许云.基于stata12.0软件数据分析,提升远程教育课程团队教学质量[J].现代远距离教育,2014,(5):35-41.

[4]陈强.计量经济学及stata应用[M].北京:高等教育出版社,2015:1-10.

[5]李子奈,潘文卿.计量经济学[M].北京:高等教育出版社,2015:3-8.

[6]林晚发.数据分析在会计财务教学中的重要[J].教育教学论坛,2017,(34):113-114.

[7]李颖.“一带一路”背景下中国与东南亚国家贸易潜力研究[J].上海商学院学报,2019,(2):32-41.

[8]王琳琳.品牌价值观一致性如何影响在线顾客态度?———基于顾客品牌情感融入的中介效应[J].商业经济与管理,2017,(4):57-69.

[9]李成彬,庄心怡,游小珊,宣碧莹.基于移动互联网的共享经济商业模式创新[J].上海商学院学报,2018,(8):22-28.

数据分析论文范文5

关键词:毕业论文成绩;因子分析法;SPSS

1引言

毕业论文是大学生对4年所学的一次总结,学生运用自己所学的专业知识以及通过查阅文献了解相关的专业知识来书写论文。毕业论文成绩的考核是有一定的流程的,一般是先由指导老师评分,指导老师评定各项分数后,将各项分数相加,得到一个总分,然后交由答辩小组,在答辩小组中,先由评阅人进行评分,再在答辩的过程中进行评分,判定学生毕业论文的成绩,答辩完成后,将材料交由学校毕业论文指导委员会,最终由学校毕业论文指导委员会评定最终成绩,评定学生的毕业论文成绩分数,为学生进行排名。这种方式只能出现终极的成绩,但是并不能分析学生的个人能力和成绩差异的原因。因此,对学生的成绩的数据分析是非常必要的。找出一种合理的分析方法对学生毕业论文成绩进行评定,综合地分析学生毕业论文成绩,从而合理地评定学生的毕业论文成绩等级,让我们能更加清晰明确地了解学生的个人能力。若要将数据处理与分析和学生的毕业论文成绩分析相结合,需要一种综合地多元化统计分析方法。在这种大量复杂的学生成绩数据中进行分析和处理,找出影响学生成绩的各项因素,对数据的深度挖掘和分析就尤为重要。而因子分析是多元统计学中非常实用的数据分析处理方法,这种数据分析处理方法是非常深入以及有着科学地解释性的依据。

2统计方法

运用因子分析针对学生的毕业论文成绩的构成,对数据进行分析,处理,为学生的等级评定和综合排名提供了科学合理的依据,对学生成绩的分析寻找各个影响因素,对学生的个人能力有一个全面的了解。这也为学校的教学以及对学生的个人能力发展提供了一个科学合理的依据与参考。因子分析是运用几个相互无关的因子来代替多个复杂变量去表示数据变量之间的关系,也就是说将数据的原始变量进行分解,将相关性比较密切的几个变量归在同一类中,这一类变量就称为一个主因子,用较少的几个主因子来反映原始数据的大部分信息以及如何使各个因子变量具有科学的依据的一种多元统计分析方法。运用这种研究技术,我们可以方便地找出影响数据的主要因素有哪些,以及它们的影响力。使用这种研究技术,我们还可以分析数据各个因素的相关性,可以科学地解决影响数据的问题,在复杂多维的数据中为我们研究大数据提供了便利。因子分析是根据数据变量间的相关性,运用几个因子来代表原来的初始变量,使这几个因子能用线性组合表示与初始因子的关系,这几个因子也称为公共因子,这种主因子是帮助我们简化了项目地复杂程度。因子分析不是简单地对数据原始变量进行组合,而是对数据原始变量进行分析,将多个变量分解为公共因子和特殊因子两部分。就是要找出数据中隐性的具有相关性的变量,利用少数几个变量在数据中独立的变量因子,然后利用各变量的测定来反映因子的情况。因子分析中是把变量表示成各因子的线性组合。在因子分析中,是寻找公共因子的多元统计分析方法,它运用主成分分析方法确定公共因子,以公共因子来反映初始变量之间的联系。因子分析是为了减少分析初始变量的个数,利用变量间的相关性的关系,将变量分类,也就是说将相关联度高的变量分为一组,用共性因子代替该组变量。因子分析模型建立后,还有一个重要的作用是应用分子分析模型去评价每个样品在整体中的地位,即进行综合评价。总而言之,因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释,然后根据步骤进行因子分析。

3实例分析

采用因子分析法与聚类分析法进行分析,来解决问题。通过分析论文成绩来分析。以表1的标准分析毕业论文数据,先在学校全体毕业学生中随机抽取30名学生的毕业论文,再通过数据分析来解析问题。为了在SPSS中使变量易于简便编写,先在这里设定A:目的明确,符合要求;B:意义与价值;C:选题恰当;D:查阅文献;E:综合知识运用;F:方法的应用;G:外文的应用;H:研究方案设计;I:文题相符;J:写作水平;K:写作规范;L:论文篇幅。先打开SPSS,录入数据,进行因子分析。从图上看,这个输出结果可以知道从数据中可以取3个主成分。取3个主成分时,原始数据的信息总量超过70%,并且他们的特征值都大于1,这说明数据反应的信息量是有效的。所以我们取3个因子,就是说12个变量可以综合成3个公共因子F1,F2,F3。

4结束语

在进行因子分析中,可能存在许多瑕疵。在数据上并不是大数据,只是小数据的分析,但是还是能反应毕业论文成绩的评定的。当然,这一切只是个理想情况下的假设,在现实生活中还是缺少一定的应用成分的。对于因子分析来说,就是就所有的变量集合规划,通过其相关性的联系,找出其公共的因子,将减少变量的个数,这样便于分析。

参考文献

[1]骆方,刘红云,黄昆.SPSS数据统计与分析[J].清华大学出版社,2011.07.

[2]王力宾.多元统计分析:模型,案例及SPSS应用[M].经济科学出版社,2010.03.

数据分析论文范文6

1研究背景及意义

在经济全球化的背景下,随着人们生活质量的不断提高,人们对出行的代步工具的需求越来越大,在综合方便、舒适等条件下,汽车便成为了广大消费者的最优选择。据中国汽车工业协会统计数据显示,2020年汽车产销分别为2522.5万辆和2531.1万辆,产销量在全球连续领先。据太平洋汽车网销售统计数据显示,2020年热度最高的车型为东风日产系列的轩逸牌轿车,其2020年1~12月总销量在各大轿车车型中排名第一,在紧凑型车车型中排名第一,综合太平洋汽车网所提供数据分析,轩逸牌汽车已经受到了广大消费者的青睐。因此,本文将东风日产系列中的轩逸轿车作为研究对象。论文主要采用数据挖掘技术和数据分析方法,获取太平洋汽车网上的轩逸轿车论坛相关评论文本信息,并对这些评论文本信息进行预处理后,分析出消费者对该型汽车产品的积极、消极或中性的情感,引用BERT模型算法并进行指标值计算,利用负面情感分析和词云分析挖掘出消费者对车型本身的关注点,最后结合4P营销策略和情感分析结果,对车企提出相关建议。论文研究有助于对有购车需求的潜在消费者提供做出购买决策的重要依据;另一方面,还对汽车商家准确把握消费者的情感倾向、改善产品和服务、制定正确的销售决策和增强企业在行业中的竞争力具有重要的战略指导意义。

2研究现状

目前,国内外对情感分析的研究有很多,但大多都更偏向于社交网络(诸如微博、微信等)的文本情感分析,专门针对汽车行业的研究却寥寥无几。根据论文研究内容,由情感分析展开国内外研究现状的论述。情感分析又称意见挖掘,是对有感情色彩的主观性文本进行分析、处理、归纳和推理的过程。在国内,情感分析领域的研究已经取得了巨大成果,有对微博等社交网站评论进行情感分析的,也有对互联网上某一具体产品的评论文本进行细腻度情感分析的,一些学者更是专门针对汽车领域,就消费者消费价值取向与对汽车产品的情感倾向等问题做出了深入的研究与探讨。苏菊芳通过对图书馆读者的评论文本进行情感分析,得出图书馆读者情感极性从而采用本体的形式构建图书馆读者情感画像库,为读者的个性化推荐提供了新的研究思路,实现了读者的情感知识语义检索与共享[1]。杨立公等则以文本颗粒度为视角,从情感词抽取等五个方面对文本情感分析文献进行了梳理,并指出了当前情感分析系统准确率不足的问题[2]。王献伟结合了Spark平台提出应用文本情感分析来挖掘商品评论中的特征属性信息,选取了京东商城上行业排名前五的智能冰箱评论作为研究对象,通过对评论语料中智能冰箱各属性的情感倾向进行分析,获取各属性在市场上的褒贬评价[3]。周立柱等则对情感分析的研究对象和目标进行了定义,详细地回顾和分析了主要的处理方法,简要的介绍了一些相关的情感分析问题,并对情感分析现有的成就、不足和挑战进行了总结[4]。王琛则通过获取了商品以及电影评论数据,提出了Word2vec的情感分析方法,并设计实现了一个在线实时情感分析系统,方便了用户实时查询,具有可操作性、准确性、直观性等优点[5]。

3BERT模型

DevlinJ等于2018年时提出了BERT模型,并指出模型是一种NLP领域的与训练模型。BERT模型的核心内容是找出目标文本中每一个词汇与其他任意词汇的关系,在这基础上,将词汇与句子中或文本中其他词汇的联系充分表示出来,即BERT模型能更清楚地展现出词汇在上下文的不同语义。其中,E1,E2,…EN表示需要进行训练的目标文本中的文字的输入,在经过编码层的双向的Transformer编码器后,输出的就是目标文本的向量化表示结果,即T1,T2,…TN分别对应输入字的向量化表示结果。BERT语言训练模型和其他模型相比,层数更深,对词向量表示的结果更加泛化,能够对目标文本中的任意词汇或句子之间的关系进行更详细地描述。但由于BERT模型在向量化时是经过编码层的双向Transformer编码器所进行操作的,其输出结果中的词包含了该词在其他句子中的所有语义,这对预测结果会产生影响。为解决此问题,BERT模型提出了两个预训练任务模型:Masked语言模型(MaskedLanguageModule,MLM)和下一个句子预测(NextSentencePrediction,NSP)模型。

4数据分析模型构建及分析

4.1BERT模型相关指标值计算

BERT分类算法的任务中,官方代码文件中给出的评价指标只有准确率(Acc)与损失(Loss),为使实验结果更准确,论文在官方代码基础上,新增了召回率(R)与精准率(P)的计算,然后加入到Return字典中,部分代码如图1所示,输出指标值如图2所示。从图2可以清晰看出,准确率(Acc)值为0.8901413,精准率(P)值为0.91316281,召回率(R)值为0.89652703。通过计算,最终得到的F1的值约为0.904768456,即F1为90.48%。实验结果表明,BERT模型分类方法能够有效地处理词汇本身在文本中不同位置的语义,且对中文文本的分类效果比较显著,对情感极性的预测准确。

4.2基于ROSTCM6软件的情感倾向分析

本文采用了由武汉大学教授团队开发的ROSTCM6软件,对目标文本进行了情感倾向分析,分析过程如图3所示。由图3可知,通过ROSTCM6软件进行情感分析,可得到正面情绪结果、负面情感结果以及情感分析的详细结果。分析得出,轩逸论坛中多数车主对产品本身持积极情感,希望继续保持。在情感分析后,通过得出的正面和负面情感文本,利用该软件对负面情感文本进行社会网络和语义网络模型分析(论文没有对正面情感进行分析,因为正面情感部分代表着车主对该汽车的认可度比较高,说明商家在许多地方做的不错,满足了消费者的需求,因此,论文只针对负面情感文本进行分析,挖掘出消费者对汽车的关注点以及期望提高的产品性能和品质)。如图4所示,经分析可知多数车主对产品本身是认可的,希望商家继续保持(负面情感语义网络图中基本上没有结点,因此初步判断车主对该产品负面情绪不集中,即属于特殊情况)。

5总结

数据分析论文范文7

关键词:新会计制度;财务数据分析;高校

一、引言

网络信息技术、数据分析技术和云计算技术在信息处理、信息传输、信息挖掘上呈现出巨大的优势,势必推动高校的财务数据分析工作。而新政府会计制度的实施,对高校的财务管理工作提出了新的要求和标准,通过财务数据分析为高校财务管理和决策提供有价值的信息,进而提高高校财务管理水平的需求凸显,然而目前高校财务数据分析却存在许多问题,为此论文基于新会计制度背景,深入研究高校财务数据分析面临的问题及对策。

二、高校财务数据分析概述

1.高校财务数据分析含义

财务数据分析是数据分析技术在财务工作领域的应用。高校财务数据分析就是对高校的预算、账册、报表等资料中列示的各项数据指标,采用一系列的专业方法,进行总结与比较,对学校一段时期内的运行和管理状况进行客观的分析、评价,从而在相关联的数据中发现存在的问题,为学校日常管理和决策提供建议。

2.高校财务数据分析的内容及方法

(1)数据分析内容。高校财务数据分析的内容主要包括财务基础数据分析和具体业务情况分析两大方面。财务基础数据分析是从会计账务系统中抓取实时形成的、及时反映学校的财务收支情况及各项资产状况的财务数据,并据此形成的月报、年报等各种形式的综合财务报表进行分析。包括对收支总表的分析、银行账户余额分析、国库资金总体情况分析。业务情况分析是通过对财务系统中抓取的各类基础数据的分析结果与相关业务部门的反馈具体业务情况相结合,形成具体业务数据分析报告,直接反映学校各个业务单位的经济情况。包括对教育事业收入明细情况的分析、对科研经费收支情况分析、往来款分析、预开发票分析。(2)财务数据分析方法。新会计制度下,采用合理有效的财务数据分析方法是财务数据分析的重要保障,高校比较常用的是比较分析法和趋势分析法。比较分析法是财务数据分析的基础方法,是其他各种分析方法的基础。它通过对绝对数和相对数的分析,对即期数据与历史标准、实际数据与预算标准进行分析比对,从而得出对实际工作效率的各种评价。趋势分析法是通过对财务数据中不同时期的相同的指标数据进行总结和分析,并根据总结和分析的结果,了解高校财务状况,结合外部环境的影响,从而预测高等学校未来发展趋势,是对高校长期目标的指引。

三、财务数据分析在高校应用中遇到的问题及原因

1.基础财务账册账表数据前后期统计归口口径不一致

目前实际工作中,由于有些财务制度的可操作性不强,同时有些业务流程不够完善,这就造成在实际工作中不同的财务人员对财务政策和会计处理程序的把握灵活性太大、尺度不一。相同的业务不同财务人员使用的会计处理方法不一样,或者对不同时期的类似支出处理标准不一致、分类的口径不一致,从而造成工作标准的不一致,进而影响数据的可比性。

2.各部门沟通不足

虽然从事财务数据分析的是财务人员,但财务数据分析工作顺利开展需要高校各相关业务部门的密切配合,才能保障财务数据分析工作的全面性和有效性。在实际工作中,一方面因为高校财务部门本身对财务数据分析工作的立意角度认识不够,从而使高校财务数据分析工作的站位不够高,把学校层面的工作在落实的过程中变成了财务部门的工作;另一方面由于各高校对财务数据分析工作重视程度存在差异、高校各部门之间利益相关者的思想或其他原因,财务部门职权有限,而其他业务部门与财务部门之间的沟通机制不够健全有效,从而导致财务部门在财务数据分析中获取的信息具有一定的片面性,无法从全局角度综合考虑高校情况。

3.财务工作人员综合素养需要提升

单就财务数据分析而言,属于相对完备的一项技术,可是在应用与研判与之相关的分析结果时,从事相关工作的人员其专业素养与业务能力也应达到一定水准。在大部分高校中,财务数据分析是财务人员的常规工作,但因为财务人员的整体素质和水平有限,使财务数据分析仍停留在表面层次,缺乏足够的数据整合与挖掘潜在信息的能力。往往只对表面的数据得出了一些简单的比较结果,但这些比较数据预示着怎样的业务发展状况、风险情况,却没有提及,忽略了数据背后、数据之间更有价值的潜在联系,无法从纵深上强化对基础数据的应用,无法提供更加优质的数据分析结果,造成财务数据分析提供的信息的有用性并不理想。如何能做出一份深入有效的分析报告、及时准确的趋势预测报告,是摆在每个财务数据分析人员面前的一项重要任务。

4.缺乏有效的绩效考核机制

目前,各高校普遍尚未建立完善的问责与激励制度,对财务数据的分析结果往往缺乏关注和考量。公开程度和应用效果的局限造成了财务数据分析的结果没有很好的应用到实际工作中,没有发挥其对高校发展决策应有的作用。有些高校没有将预算执行数据的分析结果与绩效考核相挂钩,使业务部门对预算执行情况不够重视,造成预算编制结构不合理进而影响预算执行进度。近年来,国家对科研经费的使用和管理都提出了新的要求,但科研经费数据分析的结果与科研经费的绩效评价结合不够,无法更好了解科研经费的使用结构与进度,进而影响国家对科研经费“放、管、服”政策的落实。

四、新会计制度下完善高校财务数据分析的对策

1.完善数据分析工作的运行机制

加强制度建设与流程再造,财务处理系统跟信息处理系统等都应与制度环境的改变相适应,以免因自身原因造成难以顺利开展财务数据分析工作。确保管理会计体系完备、预算体系完善,能实现数据共享,更利于顺畅进行财务数据分析工作。而要想做好内部控制工作,首先财务工作者一定要分工明确,互相协作与制衡,确保能在第一时间发现财务问题并提出相应解决方案。财务工作作为管理活动,在推进过程难免会遇到各种问题。对此,各部门尤其是财务部门对发现的问题必须仔细研究、分析问题产生的原因以及高校内部财务风险控制工作中需要不断改进的环节,从而避免类似的情况再次发生或变相出现。

2.通过加强高校的信息化建设保障各部门之间信息沟通顺畅

要做好新体制下财务数据的基本分析,需要及时掌握各类最新的政策法规、文件精神,掌握大量背景资料,收集大量的数据和信息。当前大部分高校的信息化建设已具备较好的架构,但部门之间仍然存在信息孤岛,因此高校需要对数据互联平台不断优化,以确保财务与人事、科研、教务、后勤等部门的相关有效信息做到及时共享,从而大大提高信息工作及财务数据分析工作的效率。

3.全面提升财务人员素质

把新政府会计制度实施作为财务人员理论水平和业务水平学习和提高的一个重要契机,不断提高财务人员业务素质,做到一专多能、全面发展。财务人员对高校财务数据的处理原则等要有果断准确的判断,对财务数据分析要有全面深刻的理解。根据新政府会计制度编写制订新的会计核算操作手册,严格、准确适用会计制度与科目,确保财务数据不混乱。强化对财务数据分析中出现的异常及重大数据的重点关注。制单与复核岗分离,确保业务的准确性、安全性。

4.建立有效的财务数据分析结果的综合利用机制

(1)各部门要加强对财务管理工作的重视程度。各部门应保持高度协作与交流,尽可能将数据分析的预测控制功能有效发挥出来。确保及时发现并解决那些对高校发展不利的问题,将风险扼杀在摇篮中。做到及时规避、化解风险,避免产生更大的影响,及时分析财务工作中存在问题的原因。(2)财务数据分析结果的综合利用、事后追责与部门绩效考核相结合。通过对财务数据分析结果的研判,一方面对于已经造成一定影响的财务管理问题,结合高校内控制度的实施,追究相关部门的责任,对其他部门起到震慑作用。另一方面要充分与高校的绩效管理体制改革相结合,把财务数据分析最终结果与绩效考核相连接起来,促使财务数据分析结果常规化,进而不断提高高校财务管理水平。五、结论与展望随着高校发展规模的不断扩大,通过“双一流”“优质校”等项目的不断推进,高等学校的办学层次不断提高,各项资金对高校的倾向力度不断加大,高校财务管理工作的重要性更加凸显。与此同时,高校要深化办学成本理念,根据时代的要求和学校的发展战略,积极创新,充分利用各种分析手段,加强对财务数据的分析的获取、配置、应用使财务工作由核算型转变为管理型,更好为高校发展出谋划策。

参考文献

1.方红光.大数据下高校财务管理信息化建设分析.商讯,2020(21).

2.杨春子.新形势下高校财务分析存在的问题及对策研究.中国管理信息化,2020(14).

3.肖虹霞.高校财务分析指标体系构建研究.合作经济与科技,2020(07).

4.苏菁,王成新.以数据挖掘为基础的财务分析初探.科技经济导刊,2019(33).

数据分析论文范文8

关键词:教育科研能力;中职教师

一、教育科研能力表现形式

“教师成为研究者”是新一轮国家基础教育课程改革的不断深入的结果。如果说教师具备的科研意识是教师开展教育科研的精神动力的话,那么教师的科研能力就是教师的教育科研走向成功的铺路石。科研能力通常包括很多方面的内容,笔者研究发现中职教师教育科研能力主要表现为教师发现问题能力,就发现的问题提出质疑问题的能力、信息资料搜索和处理能力、问题设计能力、实际或实训操作能力、数据分析能力和写作能力六方面。

二、中职教师教育科研能力存在主要问题

中职教师的工作重心往往在德育管理方面,教研科研的时间和精力相对较少,因此,大部分中职教师敏锐地发现教学中存在值得研究问题的能力不够,信息搜集和处理能力薄弱,缺乏通过中国知网、百度、高校的数据库查阅文献资料的能力,不善于从大量的文献资料中选择对研究课题具有参考价值的文献资料,部分教师对文献资料检索且资料整理归纳的能力偏弱,撰写文献综述的能力有待改善,借鉴和利用文献中己有的研究成果能力水平不高。大部分中职教师设计问题解决能力差,对研究结果或实验数据的假设和预测能力较弱,根据研究内容选择合适的研究方法往往束手无策。不少中职教师实际操作能力差,表现在不能根据研究计划按步骤有效实施教学研究,在研究中遇到困难时不能及时调整研究方案。教师对实验数据分析能力不高,撰写高水平论文能力差,不少教师不能够对研究资料进行定性归纳,不能够运用教育理论去分析阐述问题,不能较好地提炼并表达自己的观点。那么,提升教师科研能力,打造能科研、会科研、善科研的中职教师队伍真的很难吗?答案是,不!

三、中职教师的科研能力的提升路径

随着中小学教师对科研性质认识的不断加深,大部分教师对科研是持接受并学习的态度。据调查,大部分中职教师有比较强的科研意识,否认“科研无用论”,肯定科研的价值与意义。态度决定一切,能力不行勤奋来凑,只要肯努力,中职教师的教育科研能力是可以提升的,也一定能提升的。问题是怎样提升?

1.加强理论学习,提升中职教师教育科研能力

中职教师可以通过各种方式大量阅读教育教学理论、与专业发展的相关资料、教育教学改革经验等;中职教师不断思考深化阅读所得的知识,能结合旧知识和自身经验,不断完善自身的知识结构,加强教师之间交流和研讨不断获得新的信息,取长补短,发挥团队效应的正能量;中职教师积极掌握新时代教育理念,加强心理学、教育学的学习与研究,设法摆脱“教书匠”的状态,做到因材施教,以学生为中心,创新教学方法,懂得职业教育教学活动的规律和中职学生身心发展的规律,学习睿智的教育者探索和思考的结果,快速提升自己的科研能力。

2.加强实际操作,提升中职学校教师教育科研能力

中职教育是基础职业教育,职业教育是实践教育。对于教育科研能力的提升路径,中职教师当然可以通过学中做、做中学,掌握教育科研的过程和方法,提升科研能力。纸上得来终觉浅,绝知此事要躬行。无论是教育科研方法的实施、数据分析技术、信息技术处理、报告撰写,都需要教师真正去用,去做,才能够了解、清楚、熟悉,乃至从容驾驭。良好的教育科研素养可以让教师在教育教学过程中发现问题,特别是把教学过程中出现的问题转化成研究课题,继而能给研究课题下得出操作性定义、形得成研究方案。一方面可以让教师在鲜活的实践中做真实的研究,另一方面可以让教师不再把问题看成是令人头疼的“问题”,而是看成闻之则喜的专业发展“增长点”。所有这一切均在做的过程中慢慢体验到的。

3.加强写作操作,提升中职学校教师教育科研能力

良好的论文撰写能力是教育科研能力的重要组成部分,因此广大中职教师需要加强写作能力的培养。中职教师可以研修论文写作的基础常识课程,完善自身的论文写作知识结构,要细心观察专家论文的规范,撰写的论文符合“潜规则”,要给人感觉像论文,而不是自己孤芳自赏,可以经常撰写教育笔记,提炼自己的教育教学所思所得,形成自己的一家之言论文是在研究结果,不是随意抄袭别人的东西。“熟读唐诗三百首,不会作诗也会吟”,中职教师可以做阅读专家论文,厚积薄发,积累一定阅读量后,自己的写作能力不知不觉地提高了。提出问题,回答问题,把整个过程表达出来就是论文。撰写论文就是解答问题的过程,所有的论证都是环环相扣的来证明你的回答的。大概的结构笔者对这个时期的解读(包含笔者自身观点),然后案例分析(印证笔者观点),接着分析数据,分析结果,得出

四、结论

苏霍姆林斯基说过:“如果你想让教师的劳动能够给教师带来一些乐趣,使天天上课不至于变成一种单调乏味的义务,那你就应当引导每一位教师走上从事一些研究的这条幸福的道路上来”。中职教师的成就感相对较低,如果广大中职教师能提升自身科研能力,让自己学会教育科研、做好教育科研,又不觉得那是额外负担而是职业福利,不是过重的压力而是发展的动力,那么必定会提高中职教师的幸福指数,主动创造适合中职学生的育人模式,提升教育教学质量。

参考文献:

[1]郭秋景.农村中小学教师科研素养现状及提升策略[D].宁波大学,2017(4).