基于数据挖掘技术的旅游景点客流量预测

阅读: 评论:0

基于数据挖掘技术的旅游景点客流量预测
张占孝
阿里山香烟图片(西安职业技术学院动漫软件学院,陕西西安710061)
要:为了提高旅游景点客流量预测准确性,提出了基于数据挖掘的旅游景点客流量预测模型。首先采集旅游景点客流量历史数
据,然后通过引入混沌算法构建了旅游景点客流量预测的学习样本,最后引入数据挖掘技术对旅游景点客流量预测进行建模,并引入粒子算法对旅游景点客流量预测模型参数进行优化。与粒子算法优化BP 神经网络的、支持向量机的旅游景点客流量预测模型的仿真对比测试结果表明,本文模型可以更加准确描述旅游景点客流量变化特点,旅游景点客流量预测误差远小于对比模型,获得了理想的旅游景点客流量预测预测结果。
关键词:预测建模;数据挖掘技术;学习样本构建中图分类号:TP18
文献标识码:A
文章编号:1003-7241(2021)004-0068-05
Prediction of Tourist Flow in Tourist Attractions Based on Data Mining Technology
ZHANG Zhan -xiao
(Xi'an V ocational and Technical College Animation Software College,Xi'an 710061China )
Abstract:In order to improve the accuracy of tourist flow prediction in tourist attractions,a prediction model of tourist flow in tourist
attractions based on data mining is proposed.Firstly,historical data of tourist flow in tourist attractions are collected,and then learning samples of tourist flow forecasting are constructed by introducing chaos algorithm.Finally,data mining tech-nology is introduced to model tourist flow forecasting in tourist attractions,and particle swarm optimization is introduced to optimize the parameters of tourist flow forecasting model in tourist attractions.Compared with the simulation results of BP neural network optimized by particle swarm optimization and support vector machine,the model in this paper can more ac-curately describe the change characteristics of tourist flow in tourist attractions.The prediction error of tourist flow in tourist attractions is far less than that of the comparison model,and the ideal prediction results of tourist flow in tourist.
佛山旅游攻略景点必去Key words:forecasting modeling;data mining technology;learning sample construction
收稿日期:2019-11-11
1引言
旅游景点客流量建模与预测可以帮助管理人员了解旅游景点客流量的变化趋势,制定相应的管理措施,因此旅游景点客流量的预测研究具十分重要的意义[1-3]。
最早人们采用时指数平滑法,趋势线法等对旅游景点客流量进行预测,它们旅游景点客流量预测偏差大[4-6];随后出现基于因果分析法的旅游景点客流量预测模型,如:线性回归、灰预测理论等,它们难以精确刻画旅游景点客流量变化特点,旅游景点客流量预测精度低
[7-9]
最近年来出现了基于各种神经网络的旅游景点客流量预
测模型,预测效果要明显其它方法[10-12]。人工神经网络基于大数据定理,当训练样本数量大时,旅
游景点客流量预测精度高,反之,预测精度低。支持向量机是一种机器学习算法,非线性回归能力强,在许多领域得到了广泛的应用[13-15]。
为了改善旅游景点客流量预测效果,提出了基于数据挖掘的旅游景点客流量预测模型(PSO-SVM),通过仿真实验测试了其性能。
2基于数据挖掘技术的旅游景点客流量
预测模型
68
2.1支持向量机
支持向量机是一种数据挖掘技术,给定旅游景点客
流量数据集:T={(x 1,y 1),(x 2,y 2),…,(x l ,y l )}∈(R n ,y)l ,l 表示样本数,其中,x i ∈R n 表示旅游景点客流量的输入向量,y i ∈y,i=1,2,…l ,表示旅游景点客流量的输出,那么支持向量机就建立一个如下的一个线性函数:
f(x)=(w,x)+b
(1)
式中,ω为权值向量,b 为偏置量。
为了使络流量数据集线性函数拟合精度控制在ε以内,需要寻一个最小的w,
(2)
通常情况下,可以允许拟合误差,因此引入松弛变量ζi 和ζ*i ,
那么式(2)变为
(3)
式中,C 表示惩罚参数。
引入Lagrange 乘子a 和a *,式(3)转化为一个对偶问题,
火车站附近的宾馆即
(4)通过对式(4)进行求解,得到了a 的值,从而可以求得w 的值,
具体计算公式为:
(5)
根据KKT 条件得到b 的值,
具体为
(6)
最后得到支持向量机的络流量预测回归函数为
(7)
由于络流量具有非线性变化特点,因此引入核函数代表内积变换,当前核函数类型很多,本文采用高斯径向基核函数,
具体为
(8)
式中,σ表示宽度系数。
由于参数σ和C 影响旅游景点客流量预测结果,因此引入粒子算法进行优化,从而确定最优的参数σ和C值。
2.2
数据挖掘技术的旅游景点客流量预测步骤
Step1:对旅游景点环境进行分析,并根据时间前后
采集旅游景点客流量的历史值。
Step2:专家对旅游景点客流量的历史值进行分析,剔除一些异常的旅游景点客流量样本,并对其进行补全。
Step3:由于旅游景点客流量通常具有一定的随机性变化特点,历史值之间差异大,因此采用如下方式进行归
一化操作。
(9)
式中,x i 和x'i 表示第i 个旅游景点客流量样本的原始和归一化值。
Step4:为了更好的挖掘旅游景点客流量变化规律,引入混沌理论构建一个多维的旅游景点客流量数据。
Step5:支持向量机对于多维的旅游景点客流量训练样本进行学习。
Step6:采用一组粒子位置向量代表旅游景点客流量预测模型一组参数,模拟鸟觅食行为到最优的旅游景点客流量预测模型参数。
Step7:采用训练样本对建立的旅游景点客流量预测模型性能进行分析。
养马岛有什么景点综合上述建模步骤可知,基于数据挖掘技术的旅游景点客流量预测流程具体如图1所示。
3仿真测试
3.1
环球网最新消息实验数据
为了分析基于数据挖掘技术的旅游景点客流量预测结果的有效性,选择5个旅游景点客流量历史作为研究研究对象,对每一个旅游景点,收集其一段时间的客流量,5个旅游景点客流量历史样本数量如表1所示。
3.2仿真实验环境
69
采用Matlab 2018软件编写旅游景点客流量预测仿真程序,仿真实验的硬件和软件环境如表2所示。为了使数据挖掘技术的旅游景点客流量预测结果更具说服力,在相同仿真实验环境下,选择粒子算法优化BP 神经网络的旅游景点客流量预测模型(PSO-BPNN)、标准支持向量
机的旅游景点客流量预测模型(SVM)进行仿真对比实验。
图1数据挖掘技术的旅游景点客流量预测流程表1
5个旅游景点客流量历史样本数量分布
旅游景点编号
12345
历史样本数量
200400300300500
3.3旅游景点客流量的学习样本构建
由于本文只考虑旅游景点客流量的历史样本数据,
认为旅游景点客流量影响因素已经作用于历史样本值中,因此没有考虑旅游景点客流量的影响因素,历史的旅游景点客流量是一个维的数据,数据挖掘技术无法对一维的旅游景点客流量进行直接建模,因此本文引入混沌
理论:C-C 算法[16]将一维的旅游景点客流量变换成为多维的旅游景点客流量,并将其作为旅游景点客流量预测的学习样本,5个旅游景点客流量历史样本数量的最优嵌入维和延迟时间如表3所示。
表2
仿真实验环境参数设置
环境参数名称
CPU RAM 硬盘显卡操作系统
Intel 酷睿i39100F 芝奇Ripjaws4DDR48G 三星860EVO 500G 索泰GTX1050Ti X-Gaming
Windows 10家庭版
表3旅游景点客流量嵌入维和延迟时间值
旅游景点编号
12345
嵌入维710867
延迟时间
43652
3.4模型参数的确定
将参数σ和C 作为粒子个体的位置向量,通过式
(10)和式(11)不断更新粒子的速度和位置,最后到全局最优个体位置,对位置反编码,得到最优的参数σ和C 值,通过粒子算法确定支持向量机的游景点客流量预测模型参数具体结果如表4
所示。
(10)(11)
表4
游景点客流量预测模型参数值
旅游景点编号
12345
C 132.83392.69426.9770.1486.23
σ20.8419.8413.958.6010.01
3.5实验结果与分析
3.5.1
旅游景点客流量的单步预测性能分析
将表1中的旅游景点客流量历史样本数据根据2:1
的比例划为训练样本和测试样本,并根据表3中的嵌入维和延迟时间值形成旅游景点客流量建模的学
习样本,然后采用表4中的参数建立旅游景点客流量预测模型,并对旅游景点客流量测试样本进行预测,所有模型的旅游景点客流量单步预测精度,结果如图2所示。从图2可以看
70
出,对于5个旅游景点客流量,本文模型的旅游景点客流量单步预测精度要高于粒子算法优化BP神经网络、标准支持向量机的旅游景点客流量预测模型,这表明本文模型能够有效描述旅游景点客流量变化特点,获得了更优的旅游景点客流量预测结果。
3.5.2旅游景点客流量的多步预测性能分析
由于旅游景点客流量建模与预测是将来一段时间的旅游景点客流量进行估计,单步预测结果只能对下一个时间点的旅游景点客流量进行估计,没有什么实际应用价值,因此本文进行旅游景点客流量多步预测,统计旅游景点客流量5步预测精度,结果如图3所示。对图3进行分析可以发现,相对于单步旅游景点客流量预测结果,多步的旅游景点客流量预测精度明显下降,这主要是因为预测误差不断累计,但本文模型的旅游景点客流量多步预测精度下降幅度小,而BP神经网络、标准支持向量机的旅游景点客流量预测模型的多步预测精度下降十分利害,它们的多步预测精度已经低于85%,无法满足旅游景点客流量预测的实际要求,但是本文模型对于5个旅游景点客流量,多步预测精度仍然高于85%,这表明本文模型仍然可以对游景点客流量预测趋势进行有效跟踪,再次证明了本文游景点客流
量预测模型的优越性。
4结束语
旅游景点客流量预测是当前旅游管理领域的研究热点,为了解决当前旅游景点客流量预测过程中存在一些问题,提出了基于数据挖掘的旅游景点客流量预测模型,可以得到如下结论:
(1)旅游景点客流量与多种因素相关,具有较强的随机性变化特点,传统旅游景点客流量预测错误大,无法满足旅游景点管理的实际要求。
(2)采用支持向量机对旅游景点客流量预测进行建模,对旅游景点客流量变化趋势进行深入挖掘,无论是单步或者多步预测,旅游景点客流量预测精度都高,获得比粒子算法优化BP神经网络的旅游景点客流量预测模型、标准支持向量机的旅游景点客流量预测模更理想的旅游景点客流量预测预测结果。
(3)引入粒子算法对旅游景点客流量预测模型参数进行优化,解决了当前参数凭经验随机确定的缺陷,
进图2旅游景点客流量的单步预测精度对比
图3
旅游景点客流量的多步预测精度对比
71
一步提高了旅游景点客流量预测准确性。
(4)由于旅游景点客流量与很多因素相关,本文假设因素影响程度存在于旅游景点客流量历史数据中,没有细化各种因素影响,因此下一步将对这方面进行研究。
参考文献:
[1]李倩,许伟,蒋洪迅.考虑用户口碑的旅游计划个性化推荐方法研究[J].管理评论,2016,28(6):113-118.
[2]李雅美,王昌栋.基于标签的个性化旅游推荐[J].中国科学技术大学学报,2017,47(7):547-555.
[3]樊婷,李景宜,张咪.中国入境旅游业的发展趋势及其波动周期的分析[J].宝鸡文理学院学报(自然科学版),2017,37(1): 67-71.
[4]梅梅,刘颖,唐小利,张玢.微博非结构化数据的情绪挖掘方法及在旅游预测中的应用[J].情报资料工作,2019,40(1):64-72.
[5]林甲祥,高敏节,陈崇成,等.个性化旅游景点推荐中考虑约束的关联规则挖掘算法[J].福州大学学报(自然科学版), 2019,47(3):320-326.
[6]刘艳,潘善亮.基于LBSN好友关系的个性化景点推荐方法[J].计算机工程与应用,2015,51(8):117-122.
[7]汪秋菊,黄明,刘宇.城市旅游客流量—网络关注度空间分布特征与耦合分析[J].地理与地理信息科学,2015,31(5): 102-106,127.
[8]于明涛,叶晓彤.改进粒子优化BP神经网络的旅游客流量预测[J].微型机与应用,2015,34(21):51-54.
[9]王新民,漆建武,周玉姣,谈波.基于ARIMA模型的甘肃省国内旅游客流量预测[J].天水师范学院学报,2017,37(4):82-85.
[10]张朝元,陈丽.基于PCA改进的SOR-LS-SVM公路旅游客流量预测模型[J].科技通报,2015,31(9):155-158.
[11]方伟欣,王新.一种改进的基于Geo-tagged照片的热门旅游景点挖掘方法[J].云南民族大学学报(自然科学版),2018, 27(6):512-516,529.
[12]李广丽,朱涛,袁天,等.混合分层抽样与协同过滤的旅游景点推荐模型研究[J].数据采集与处理,2019,34(3):566-576.
[13]陈荣,梁昌勇,葛立新.基于SEA的AGA-SVR节假日客流量预测方法研究[J].旅游科学,2016,30(5):12-23.
[14]汪东亮,陆依依.基于DA-HKRVM的旅游景区客流量预测研究[J].信息技术,2019,43(4):101-105.
[15]晓炫,吕本富,曾鹏志,刘金烜.基于网络搜索和CL-SI-EMD-BP的旅游客流量预测研究[J].系统工程理论与实践, 2017,37(1):106-118.三亚民宿攻略三亚民宿哪家好
[16]张涛,张颖江.基于矢量空间重构的网络流量预测算法[J].计算机科学,2016,43(7):111-115.
作者简介:张占孝(1972-),男,硕士,副教授,研究方向:计算机科学与技术。
5.3结果分析
分析每秒最大IO次数可知,在块逐渐增加的情况下,虚拟磁盘与一般磁盘间的差异逐渐变小,这主要是由于每次块读写均需和一次地址映射相应,块越小读写次数越多,本文系统读写性能更高。
针对最大数据传输速率,块越大,二者相差越大,这主要是因为最大数据传输速率与每秒最大IO次数、块大小有关,而块大小的影响因素更大,整体传输速率明显更高。
根据负载稳定性测试结果可以看出,即使负载出现改变,本文系统也可在较短时间内保持负载均衡,同时负载改变幅度不大,明显优于其它两种系统。
6结束语
上述设计基于动态增容的政务大数据资源调度优化系统,通过动态增容技术提高磁盘性能,保证整个系统的调度性能,令系统调度负载均衡稳定,有很高的可行性。
参考文献:
[1]曹兰英.大数据时代下开放教育视频云资源共享系统的设计研究[J].电视技术,2018,42(12):117-121.
[2]张光勇,侯剑.大数据分析下网络应急资源实时调度仿真研究[J].计算机仿真,2018,35(4):445-448,452.
[3]阳小兰,钱程,朱福喜.基于云计算的大数据服务资源评价方法[J].计算机科学,2018,45(5):295-299.
[4]郝春亮,沈捷,张珩,等.大数据背景下集调度结构与研究进展[J].计算机研究与发展,2018,55(1):53-70.
[5]张译天,于炯,鲁亮,等.大数据流式计算框架Heron环境下的流分类任务调度策略[J].计算机应用,2019,39(4):1106-1116.
[6]申建建,曹瑞,苏承国,等.水火风光多源发电调度系统大数据平台架构及关键技术[J].中国电机工程学报,2019,39(1): 45-57,321.
[7]周生奇,贾亚军,朱华.基于灰模糊预测的智能配电网大数据调度算法[J].中国电力,2018,51(10):103-110.
[8]周权彪,张兴军,梁宁静,等.基于缓存映射项重用距离的闪存地址映射方法[J].计算机研究与发展,2018,55(5):1065-1077.
[9]严有祥,朱婷,王蕾,等.新型输电电缆动态增容系统设计与应用[J].电力系统及其自动化学报,2018(8):133-139.
[10]刘洪霞,冯益明,曹晓明,等.荒漠生态系统大数据资源平台建设与服务[J].干旱区资源与环境,2018,32(9):126-131.
作者简介:陈吉宁(1980-),男,在职研究生,高级工程师,研究方向:电子政务、网络、云计算、大数据。
(上接第61页) 72

本文发布于:2023-07-08 16:08:22,感谢您对本站的认可!

本文链接:http://www.035400.com/whly/2/518356.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:客流量   旅游景点   预测   模型   进行   数据   研究   技术
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2024-2030 Comsenz Inc.Powered by © 文化旅游网 滇ICP备2022007236号-403 联系QQ:1103060800网站地图