上海迪士尼度假区游客在线评论的情感倾向分析

阅读: 评论:0

Electronic  Bussiness | 电子商务
莆田网红景点
MODERN  BUSINESS
现代商业42
上海迪士尼度假区游客在线评论情感倾向分析
张尧政 邓少灵
上海海事大学经济管理学院 上海 201306
摘要:旅游平台中的用户评论客观真实地反映了游客关于旅游景点的体验感受,对用户评论进行情感分析不仅能为游客提供有效,客观的决策信息,而且能为旅游经营者改进服务提供参考。本文以上海迪斯尼度假区的在线评论为研究对象,将非结构化的文本内容划分为“评论主题”和“评论观点”两部分,随后对情感倾向进行统计分析。实验表明:提取旅游评论中的“评价主题”及“评价观点”缩小了文本数据中分析范围,增加了对评论分析的准确度及深度,能更准确的为旅游经营正则提供信息。
关键词:情感分析;游客评论;评价主题近些年来,随着电子商务和网络旅游社区的快速发展,越来越多的游客选择借助于旅游平台来规划自己的旅游攻略,购买相关的景点门票,住房服务,交通运费。为
了提高顾客忠诚度,吸引消费者,旅游平台鼓励消费者分享自己的旅游体验以及对旅游地服务的看法。游客的这些看法评论可以看作一种重要的市场反馈,对其进行分析,既能很好的为游客提供决策信息,也能为旅游经营者提供改进信息。
目前,国内有不少学者对挖掘游客在线评论开展了研究。程翠琼,徐健[1]构建的模型能够有效地反映旅游地的游客情感随时间变化的波动,进而为旅游管理者、潜在旅游者信息获取提供新的信息参考渠道。刘思叶,田原等基于机器学习方法,开展游客微博主题情感分析方法比较研究。王少兵,吴升构建了能够反映游客关注度和情感分析的方法,为游客决策提供参考依据。王新宇将基于词典和机器学习相结合,对旅游网络评论进行情感分析研究。本文在以往研究的基础上,引入了评价主题及其对应的评价观点,旨在提高情感分析的准确性,更好地为旅游运营者提供改进信息。
一、研究方法及数据获取
(一) 研究方法
一般情况下,每一条旅客评论数据都是一个旅客对旅游地的相关评价。但是这些评论数据往往不止包含一个方面,可能是多维度的描述,并且这些数据都是由文本构成的非结构化数据。因此对这些数据进行情感分析时,首先要将其处理成结构化数据,然后抽取评论主题以及相应的评论观点。通过情感分析方法以及可视化工具分析出评价主题对应的情感状况,具体研究流程如图所示。
图 旅游评论文本情感分析流程
(二)数据采集及清洗
本文利用网络爬虫对携程网旅游平台中的用户评论进行抓取。首先打开携程,到旅游景点评论板块,在站内提供的搜索功能中输入旅游景点,即可显示此旅游景点的评论数据。从显示结果中可以看出评论数据分为“很好”,“好”,“一般”,“差”以及“很差”五个等级,为了保持每个等级下评论数据的数量一致,对此我们对每个等级下前500条数据进行抓取,一共采集2500条评论数据。每一条评论数据包含用户名、“有用”的点击数量以及评论内容,将采集到的评论数据保存在excel文件中。
为了确保excel中的每一条评论数据都是真实有效的,我们以每个评论数据下的“有用”点击数为依据,只保留“有用”点击数超过5的评论,也就是该条评论有5个人赞同,并且将其中一些不相关的数据进行删除,例如,重复数据,具有广告性质的数据,最终得到1227条评论数据。清洗后的部分数据如表1所示。
表1  部分旅客评论数据用户在线评论
M39****939
如果第二天去迪士尼,前一天晚上一定要住到附近东酒店里,价格不贵而且还有免费大巴车接送...
WeCh****64384首先排队问题没有得到解决,那些人肆意妄为的插队,
黄牛太多了通道太少了,工作人员态度差差差,景不
错,可惜垃圾遍地...
随心929
景很好,价格也可以接受,就是人太多了,太累人
了,还好没有买两日票,当天下午3点多就回到酒店了...M42****562景很棒不用说,十分高大上,尽管项目本身很有趣
味,可是总体来说带来的感觉很不爽。门票很贵,性价
比很差...
为了保证文本情感分析数据的质量,进行情感分析前还要将数据进行分词,删除其中一些不必要的停用词、特殊符号以及英文。本文采取python编程语言,并利用jieba库对数据进行分词,因为jieba分词在目前的分词技术中精确度较高。并且,针对一些评论中出现的特殊词语,例如“黄牛”,“app”,“FP卡”等,可以通过构建自定义词典,对这些词语进行准确的切分,以保证分词的准确性。
二、 在线评论文本的情感分析
(一) “评论主题”及“评论观点”的抽取
首先,作者将评价文本划分为评价主题和评价观点两部分,当评价实体作为旅游服务时,这时的评价主题可以是旅游服务对应的景点,住宿等属性。对于旅游服务评论而言,评价主题除了有旅游服务的本身属性外,同样还包括交通,饮食等属性。而评价观点为评价主题对应的评价。例如:“景真的很美,就是里面的住宿太贵了,交通太不方便了”。从这条评论中可以看出,“景”、“住宿”以及“交通”作为评价主题,“真的很美”,“太贵”以及“太不方便”则是三个评价主题对应的评价观点。在此评论中可以看出,第一个评价主题对应的评价观点是正面的,但是第二个和第三个对应的评价观点是负面的。简单的对文本的正面情绪和负面倾向进行情感加总计算,这在一定程度上会影响对旅客评论的情感分析准确性。因此,我们对每一条评论抽取其评价主题及其对应的评价观点,再进行情感分析,这在一定程度上保证了情感分析的准确性,有助于得到较为客观的结论。
涂海丽等将饮食、娱乐、购物、景观、交通和住宿等作为旅客评价主题的标准,本文以此为基础,对旅客评论数据的评价主题和评价观点
DOI:10.14097/jki.5392/2019.05.020
Electronic  Bussiness
电子商务 |  MODERN  BUSINESS
现代商业
43
进行提取。同时,对一些口语化的表述进行了归一处理,如表2所示,将同义词归类到一个主题之下。
将表2的评价主题及其同义词与涂海丽的研究对比可以发现,本文在文献的基础上,针对研究对象对评价主题及其同义词进行了扩展,增加了“门票”,“服务”这两个评价主题。并将在景点旅游较少涉及到的景区外“交通”评价主题删除,增加了景区内旅客更为关注的“排队”评价主题。同样,也对增加的评价主题的同义词进行了扩展。由此形成了“门票”,“排队”,“娱乐”等8个评价主题构成的评价主题集。
郑州一日游去哪里比较好玩随后,作者运用情感分析方法对这一评价主题集进行分析。由表2中每个评价主题的评论数可见,“门票”,“娱乐”以及“排队”这三个评价主题是旅客的主要关注点。其他评价主题不论是对于旅客,还是景点运营者来说都是次要的。
(二) 文本情感分析
文本情感分析又称为倾向性分析。简单而言,就是对有情感彩的文本进行各种分析的过程。文本情感分析技术主要分为基于机器学习的技术和基于词典的技术两类。
由于评论数据大多是长文本数据,其中包含了很多评价主题,单纯的机器学习方法只能对整个文本的情感倾向做出分析,无法分析每个评价主题的倾向性。而采用基于情感词典的分析方法,通过将长文本数据转化多个评价主题及其评价观点数据,对每个评价主题进行分析,能更准确的把握游客对景区各个方面的看法,进而做出改进措施,本文针对采集到的1227条有效评论数据,分析得出如表3所示的结果。
表3  游客景点评论情感分析甘肃最发达的五个城市
评价主题正面情绪比例
中性情绪比例
负面情绪比例
门票36.6%20.9%42.5%饮食46.3%21.1%32.6%娱乐84.2%  3.4%12.4%购物30.1%50.0%19.9%景观57.4%16.4%26.3%排队  6.4%23.9%69.7%住宿71.6%  4.2%24.2%服务17.0%22.6%60.4%
从表3中可以看出正面情绪比例相对较高的是“娱乐”,“景观”以及“住宿”3 个评价对象。其中,“娱乐”评价主题作为旅游景点获得较多的评价,并且以正面情绪为主导地位。由此可见,旅客对景点的娱乐设施,项目等都是很满意的,是旅客愿意来景点游玩的一个要点,要求娱乐设施丰富的旅客可以考虑此景点。
针对“门票”主题而言,性价比往往是大部分游客首要考虑的问题,因此,如何设置一个合理的价格或者是进行活动,都是运营者需要考虑的。最重要的是,评论数最高的“排队”这一主题的负面情绪远远大于正面情绪,表明旅客在游玩景点的时候对毫无意义的排队的不满。而造成这一现象的原因可能是节假日等客观原因,但从主观角度考虑,景点运营者要考虑如何就排队做出改进。如果面对追求高效率的游客,这一点可能会让他们不会考虑景点。
将“排队”主题中消极情绪评论进行汇总分析,部分评论如表4所示。
分析表4中“排队”评价主题及其负面情绪评论可以看出,“排队”的负面情绪主要集中在排队的地方多,排队时间久,黄牛泛滥。排队的地方多,时间长则表示游客的接纳量超过了园区的承受量,特别是在节假日游客高峰期,长时间的等待让游客体验变低,可能会引起网络负面评论的连锁反应。因此,景点运营者可以通过预约机制,合理限制人流量等措施改善排队情况。黄牛泛滥这一情况,主要是针对景区项目特有的快速通行证,是迪士尼乐园特有的一种管理及服务模式。黄牛通过兜售此证谋取利益,
影响大部分游客的正常体验。管理者可以考虑从源头杜绝,在入园口,通行证发放处安排工作人员,以减少黄牛出现的可能。
三、研究总结
随着旅游电商平台的快速发展,人们越来越倾向于在线安排旅游。分析景点旅客的客观评价,不仅为其他旅客决策提供信息,同时也为景点运营者提供改进信息。本文根据在线评论文本情感分析,总结出以下结论:韩国留学条件要求
(一)“排队”,“门票”作为评价内容中提到的较多的两个评价主题,可以看出在旅客心中具有重要地位。而通过情感分析可以看出,此评价主题的负面情绪远远要大于正面情绪。对景点运营者而言,应对其进行改进。如果旅客对这两个评价主题有所要求的话,就可能会考虑是否游玩这一景点。“娱乐”这一主题同样是旅客评价中提到较高的主题,并且大多是正面情绪。
(二)通过对旅客景点评论进行评价主题划分,针对每一个评价主题对应的评价观点进行情感分析,不仅提高了分析的准确度,同时也加深了分析的深度。挖掘出了评论文本的价值,为相关人员提供了更多的信息,解决了长文本可能带来的信息丢失的情况。
(三)由于旅客评论中常常会出现口语化的词汇,这些词汇有些就是评价主题的替代词,如果忽略这些
词汇,不但会造成文本数据缺失,还会影响分析的准确性。因此,通过对评价主题进行同义词扩充,解决了这一问题。
参考文献:
[1]程翠琼,徐健.面向网络游记时间特征的情感分析模型[J].数据分析与知识发现,2017,1(02)
石狮天气预报[2]刘思叶,田原,冯雨宁,庄育龙.游客微博主题情感分析方法比较研究[J].北京大学学报(自然科学版),2018,54(04)
[3]王少兵,吴升.基于景点在线评论文本的游客关注度和情感分析[J].贵州大学学报(自然科学版),2017,34(06)
[4]王新宇.基于情感词典与机器学习的旅游网络评价情感分析研究[J].计算机与数字工程,2016,44(04)
[5]涂海丽,唐晓波.基于在线评论的游客情感分析模型构建[J].现代情报,2016,36(04)
作者简介:
1.张尧政,上海海事大学经济管理学院硕士研究生,研究方向:电子商务、情感分析。
2.邓少灵,上海海事大学经济管理学院副教授,研究方向:信息管理、电子商务。
表2  评价主题及其评价观点抽取结果
评价主题同义词
评论数门票价钱,售价,优惠,价位,性价比652饮食正餐,吃饭,吃的,喝水,餐厅,食栈234娱乐设备,项目,表演,设施871购物店铺,店面,礼品,礼物52景观景,烟花,景观
323排队等待,安检效率,客流量,黄牛964住宿酒店,宾馆,旅店109服务态度,工作人员37
表4  旅客关于“排队”主题负面情绪评论
评价主题负面情绪评价内容
排队
阴雨天,还那么多人,进入就是各种挤,每个项目都得排队50分以上...
去迪士尼玩最好的评价就是去排队的...
根本玩不到什么,排一次三小时,入园需排1个半小时,进去就是排...
每天的客流量大大超过了园区的接待能力,国人人
傻钱多...
去了是体验排队的。安检排队、项目排队、吃饭排队,体验太差...北戴河黄金海岸怎么样
黄牛众多,基本一元一分钟,花钱就可以不排队...排队人数多,预约机制不合理,没有合理计算接待人数,都意料之中...

本文发布于:2023-07-16 23:38:34,感谢您对本站的认可!

本文链接:http://www.035400.com/whly/4/187198.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:评价   评论   主题   情感   分析
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2024-2030 Comsenz Inc.Powered by © 文化旅游网 滇ICP备2022007236号-403 联系QQ:1103060800网站地图