情感分析的轩逸汽车销售策略

情感分析的轩逸汽车销售策略

在电商无限发展的今天,面对着庞大、不规则的网络评论文本数据,如何从中寻找出对企业制作销售决策有用的信息,已成为当下各大商家的关注热点。本文就这一问题展开讨论,试图挖掘出对支撑车企制定或改善销售决策有重要作用的信息。论文主要引用BERT模型并计算相关指标值,同时利用ROSTCM6软件对负面情感文本进行社会网络和语义网络分析。结果表明,超过半数购车车主对轩逸汽车的态度明显持积极情感,即该品牌汽车得到了多数使用车主的认可。最后,还运用了4Ps营销理论对情感分析过程中发现的问题进行了总结,并提出相关建议。

1研究背景及意义

在经济全球化的背景下,随着人们生活质量的不断提高,人们对出行的代步工具的需求越来越大,在综合方便、舒适等条件下,汽车便成为了广大消费者的最优选择。据中国汽车工业协会统计数据显示,2020年汽车产销分别为2522.5万辆和2531.1万辆,产销量在全球连续领先。据太平洋汽车网销售统计数据显示,2020年热度最高的车型为东风日产系列的轩逸牌轿车,其2020年1~12月总销量在各大轿车车型中排名第一,在紧凑型车车型中排名第一,综合太平洋汽车网所提供数据分析,轩逸牌汽车已经受到了广大消费者的青睐。因此,本文将东风日产系列中的轩逸轿车作为研究对象。论文主要采用数据挖掘技术和数据分析方法,获取太平洋汽车网上的轩逸轿车论坛相关评论文本信息,并对这些评论文本信息进行预处理后,分析出消费者对该型汽车产品的积极、消极或中性的情感,引用BERT模型算法并进行指标值计算,利用负面情感分析和词云分析挖掘出消费者对车型本身的关注点,最后结合4P营销策略和情感分析结果,对车企提出相关建议。论文研究有助于对有购车需求的潜在消费者提供做出购买决策的重要依据;另一方面,还对汽车商家准确把握消费者的情感倾向、改善产品和服务、制定正确的销售决策和增强企业在行业中的竞争力具有重要的战略指导意义。

2研究现状

目前,国内外对情感分析的研究有很多,但大多都更偏向于社交网络(诸如微博、微信等)的文本情感分析,专门针对汽车行业的研究却寥寥无几。根据论文研究内容,由情感分析展开国内外研究现状的论述。情感分析又称意见挖掘,是对有感情色彩的主观性文本进行分析、处理、归纳和推理的过程。在国内,情感分析领域的研究已经取得了巨大成果,有对微博等社交网站评论进行情感分析的,也有对互联网上某一具体产品的评论文本进行细腻度情感分析的,一些学者更是专门针对汽车领域,就消费者消费价值取向与对汽车产品的情感倾向等问题做出了深入的研究与探讨。苏菊芳通过对图书馆读者的评论文本进行情感分析,得出图书馆读者情感极性从而采用本体的形式构建图书馆读者情感画像库,为读者的个性化推荐提供了新的研究思路,实现了读者的情感知识语义检索与共享[1]。杨立公等则以文本颗粒度为视角,从情感词抽取等五个方面对文本情感分析文献进行了梳理,并指出了当前情感分析系统准确率不足的问题[2]。王献伟结合了Spark平台提出应用文本情感分析来挖掘商品评论中的特征属性信息,选取了京东商城上行业排名前五的智能冰箱评论作为研究对象,通过对评论语料中智能冰箱各属性的情感倾向进行分析,获取各属性在市场上的褒贬评价[3]。周立柱等则对情感分析的研究对象和目标进行了定义,详细地回顾和分析了主要的处理方法,简要的介绍了一些相关的情感分析问题,并对情感分析现有的成就、不足和挑战进行了总结[4]。王琛则通过获取了商品以及电影评论数据,提出了Word2vec的情感分析方法,并设计实现了一个在线实时情感分析系统,方便了用户实时查询,具有可操作性、准确性、直观性等优点[5]。

3BERT模型

DevlinJ等于2018年时提出了BERT模型,并指出模型是一种NLP领域的与训练模型。BERT模型的核心内容是找出目标文本中每一个词汇与其他任意词汇的关系,在这基础上,将词汇与句子中或文本中其他词汇的联系充分表示出来,即BERT模型能更清楚地展现出词汇在上下文的不同语义。其中,E1,E2,…EN表示需要进行训练的目标文本中的文字的输入,在经过编码层的双向的Transformer编码器后,输出的就是目标文本的向量化表示结果,即T1,T2,…TN分别对应输入字的向量化表示结果。BERT语言训练模型和其他模型相比,层数更深,对词向量表示的结果更加泛化,能够对目标文本中的任意词汇或句子之间的关系进行更详细地描述。但由于BERT模型在向量化时是经过编码层的双向Transformer编码器所进行操作的,其输出结果中的词包含了该词在其他句子中的所有语义,这对预测结果会产生影响。为解决此问题,BERT模型提出了两个预训练任务模型:Masked语言模型(MaskedLanguageModule,MLM)和下一个句子预测(NextSentencePrediction,NSP)模型。

4数据分析模型构建及分析

4.1BERT模型相关指标值计算

BERT分类算法的任务中,官方代码文件中给出的评价指标只有准确率(Acc)与损失(Loss),为使实验结果更准确,论文在官方代码基础上,新增了召回率(R)与精准率(P)的计算,然后加入到Return字典中,部分代码如图1所示,输出指标值如图2所示。从图2可以清晰看出,准确率(Acc)值为0.8901413,精准率(P)值为0.91316281,召回率(R)值为0.89652703。通过计算,最终得到的F1的值约为0.904768456,即F1为90.48%。实验结果表明,BERT模型分类方法能够有效地处理词汇本身在文本中不同位置的语义,且对中文文本的分类效果比较显著,对情感极性的预测准确。

4.2基于ROSTCM6软件的情感倾向分析

本文采用了由武汉大学教授团队开发的ROSTCM6软件,对目标文本进行了情感倾向分析,分析过程如图3所示。由图3可知,通过ROSTCM6软件进行情感分析,可得到正面情绪结果、负面情感结果以及情感分析的详细结果。分析得出,轩逸论坛中多数车主对产品本身持积极情感,希望继续保持。在情感分析后,通过得出的正面和负面情感文本,利用该软件对负面情感文本进行社会网络和语义网络模型分析(论文没有对正面情感进行分析,因为正面情感部分代表着车主对该汽车的认可度比较高,说明商家在许多地方做的不错,满足了消费者的需求,因此,论文只针对负面情感文本进行分析,挖掘出消费者对汽车的关注点以及期望提高的产品性能和品质)。如图4所示,经分析可知多数车主对产品本身是认可的,希望商家继续保持(负面情感语义网络图中基本上没有结点,因此初步判断车主对该产品负面情绪不集中,即属于特殊情况)。

5总结

本文结合了BERT模型、相关爬虫技术、数据分析方法,对汽车的评论数据进行了挖掘和分析,但由于欠缺机器学习知识,还存在着一些问题,在未来,将回归模型应用于销售量预测中,并与其他网站进行比较、综合分析。

作者:张龙 吴旖婷 周遵爽 蒋合领 单位:中国电信股份有限公司贵州分公司产品创新(客户研究)中心  哈尔滨商业大学计算机科学与技术 ;3. 贵州财经大学信息学院