顶岗实习系统在会计专业教学中应用

顶岗实习系统在会计专业教学中应用

摘要:顶岗实习培养职业学院毕业生的专业技能和职业素养,缩小学校教学与用人单位要求,取得了比较好的教育和社会效益。如何将顶岗实习不断积累的实践知识进行整理归类发掘并运用于学校实践教学是很重要的。本文以会计毕业生的顶岗实习数据及其相关的数据作为研究对象,利用大数据技术对其进行分析评价,找出将顶岗知识运用于会计教学的方法和途径。

关键词:大数据;顶岗实习;工作单位

1顶岗实习

顶岗实习是高职学生在最后半年,通过联系企业找到合适的岗位,进行为期近半年的企业顶岗实习,积累实践经验的过程。期间学生需要提交相应的实习资料比如企业资料,位置信息等。其中主要需要将学生自己的企业工作经历经验以每周为单位记录,然后由企业和学校老师共同评分,合格学生给予通过该科成绩。高职院校的顶岗实习系统一般是第三方公司研发的,各学校系统平台不同,但都是帮助学生记录顶岗实习整个过程,协助学生完成顶岗实习的要求。

1.1大数据来源及分析整理。我校于2016年开始使用由会计专业最先使用顶岗实习系统,已经积累了13和14两个年级的顶岗实习资料。本文提取的是会计专业是三年制专科13级和14级共200余人次的顶岗实习记录。采用的数据库软件微软sqlserver和大数据编程软件python。

1.2顶岗实习产生的数据。在顶岗实习过程中,学生在企业顶岗过程中对专业的见解、认识、心得等记录下来,形成实习周志、实结报告等是本文研究的重点。顶岗实习主要产生结构化数据和非结构化数据两种类型的数据。1.2.1非结构化数据周记:学生每周写一次本周的实习内容和心得,学校指导教师进行评价,评分。要求学生总共写够18周。写周记的目的一个是学校老师能够知道学生在这一周里主要做了些什么工作。同时也是学生进行知识和心理整理的平台,会被系统保留下来。这些内容在系统里面是以文本的形式存储,是我们分析的主要数据。1.2.2结构化数据企业信息:由学生自己录入系统,包括名称、单位性质、行业、单位类型等信息。企业信息的录入能够确保学校及老师能够依照学生的资料进行核实,另外一个用途就是为以后的学生提供了顶岗实习的企业资源。学生信息:顶岗学生自身信息包括学生自己信息:班级、姓名、性别、学号等。以便确认每一位学生情况。实习情况信息:实习单位、实习岗位校外教师、校外指导教师电话、薪酬标准、实习性质、专业对应、安排方式、是否提前参加实习、是否解锁实习结束日期、实习开始日期、实习结束日期。实习情况信息能够对每一位学生的实习情况进行了解。

2大数据的分析整理过程

这个分析过程大致可以分为三步:第一,系统自动读入所有数据,进行python的jieba分词数据清洗,去掉无用的词语及标点符号。第二,使用LDA主题模型对数据进行的语义挖掘。对有用数据进行关联分析,分类分析,聚类分析,文本挖掘等。同时为了程序能自动学习,需要人工对示例数据分类和有用性标记。第三,系统自动对会计课程的应用标记。利用大数据的分析判断,如果是教科书没有的新认识或者比书上有更深入的理解对该内容做“有用”标记。一旦该学生的某条周记被标记为有用就可以针对学生的实习单位,实习工作及所有的周记进行分析,看是否真的确定为该生的此次实习经验对学校教师以后教学对课程标准的制定具有指导意义。如果真的有,那么整理入研究报告做保存归档,以便将来使用,这是我们的最终目的。

2.1数据清洗。取的原始记录共39704条,其中13级10258条,14级29446条。首先对数据进行清洗,需要对评论内容进行如下的预处理操作:去掉重复数据,很短的评论数据,没有一个“会计”“税法”“审计”等会计专业词汇的,去除停用词,去除符号和阿拉伯数字:去除数据集中的符号如[’!"#$%&\'()*+,-./:;<=>?@[\]^_`{|}~]+等以及阿拉伯数字。同时增加了一个分类的字段,存储的是需要将学生评论按照会计课程内容进行分类,F10是有用性评价,如果评价为有用为“1”否则无用位“0”。在以下表1中给出对每个字段的描述(以SQLSERVER2008为例):

2.2中文分词。jieba中文分词用于中文分词、词性标注和关键词的抽取。有三种模式:第一,将字符串进行最精确地切分的精确模式,它尽可能地获取所有的分词可能的全模式;在精确模式获得的分词结果之上,对较长的分词结果进行二次切分的搜索引擎模式。同时对于那些不存在于前缀词典中的未登录词,则使用了Viterbi算法构建HMM模型,得到最终的切分形式。

3基于主题模型的语义挖掘

LDA主理模型概念主题是一系列相关联词语的集合,与主题关联度越高的词,它归属于该主题的可能性越大,也就是数学条件概率大,所以主题是一种基于词汇的条件概率分布。一段文本往往包含了多个主题,而主题模型正是针对这些隐含主题构建出来的一种建模方法。基于这样的思路,文本中每个词出现的概率可如公式(1)所示:p(词语|文本)=S主题P(词语丨主题)x)p(主题|文本)(1)若表现为矩阵,则是公式(2)所示:“文本—词语”矩阵=“主题—词语”矩阵x“文本—主题”矩阵(2)其中,“文本—词语”矩阵为文本中词出现的概率矩阵,“主题—词语”矩阵为主题中词出现的概率矩阵,“文本—主题”矩阵为文本中主题出现的概率矩阵。针对一个己知的文本集,使用分词工具对文本集中的文本进行分词操作,基于分词结果可以计算出文本中每个词的词频,进而得到概率公式左边的“文本—词语”矩阵,而所谓主题模型,就是通过对“文本—词语”矩阵的训练学习出“主题—词语”矩阵和“文本—主题”矩阵,从而获得文本中的隐含主题信息。

4数据分析结果

对于学生顶岗有用周记的分类构成有如下表2的数据:我们通过研究发现学生顶岗很大部分工作岗位是报税,对报税需要加大学习力度。另外出纳,审计,电算化等也比较多。这个结论与实际相符合的,因为对于会计专业来说内容变化更新最多的是税法知识,所以占的比重最大。对于学生顶岗所在行业的统计有如下表3所得的数据:从所在行业来看,商业、金融业、制造业占了吸收学生的前3强。第三产业对人员的需求强劲,占了三分之一强。对于学生顶岗单位性质的统计有如下表4所得的数据:从上表的数据可以看出,机关事业单位也占了近12%,这个跟我们以前直觉应该更低,有一定的不同。对于学生顶岗单位国企机关事业单位学生分布的统计有如下表5所得的数据:从上表的数据可以看出,(3+2)的学生更能获得国企机关事业单位工作,而统招班学生获得这样机会就大大减少。对于学生顶岗单位性质的统计有如下表6所得的数据:从上表的数据可以看出,校外实训基地也发挥了一定的作用。小结:通过以上数据综合分析,我们可以得到:学生平时所学知识在实际岗位上对学生影响最大的是税法,因为税法的实际应用最强,对企业影响也比较大而且经常调整;批发零售金融是服务业需要人员比传统生产企业多,在人才培养上需要更多的倾向服务业会计业务的学习;机关事业单位越来越受到(3+2)学生的关注,在他们的课程设置上也需要相应的涉及;对于统招学生多关注实际技能的培养。

5结论及应用

对于最后得到的有用数据,教研室的老师要进行专门的教研活动,对此结果进行吸收和提出建议,此建议保留,返回给顶岗分析系统进行改进。对于这些有用的知识,还可以按照不同行业的特点,对其进行行业划分,分行业进行知识的积累形成知识体系。吸收的知识融入老师平时实训课的内容中,针对高年级学生的综合实训课程相关教师更是应该注意学习和吸收里面的新知识,逐步提升会计专业实践教学能力。

作者:任之蓉 单位:成都农业科技职业学院经济贸易学院