基于熵加权子空间算法的旅游数据聚类分析

阅读: 评论:0

辽宁东戴河天气预报
Clustering Analysis of Tourism Data Based on Entropy Weighting k-means Subspace Algorithm 作者: 陈丹[1];褚宏伟[1];吴雅琴[1];胡俊[1,2]
什么人可以进杜莎夫人蜡像馆作者机构: [1]云南大学数学与统计学院,云南昆明650091;[2]云南农业大学理学院,云南昆明650201
出版物刊名: 旅游研究
页码: 18-31页
中国国家博物馆有哪些展厅
千岛湖两日游攻略年卷期: 2021年 第5期
招聘网boss直聘主题词: 熵加权子空间算法;旅游数据;子空间聚类;数据挖掘
摘要:大数据背景下,高维旅游数据的急剧增长使得传统聚类算法效果欠佳,而熵加权子空间算法可有效地实现高维数据聚类,获取特征对不同类的影响,从而提升聚类效果.文章通过爬取同程网上的部分云南游记数据,获取有关云南旅游的游记信息;借助中文分词、关键词提取、词性识别等自然语言处理技术,并结合百度地图API游记信息,构建所需旅游数据矩阵;基于用户—关键词矩阵,采用熵加权子空间算法对旅游景点和作者进行聚类;综合考虑邓恩指数和轮廓系数两个内部指标,对聚类结果进行评价.评
价结果表明:采用熵加权子空间算法对云南游记数据聚类时,其集簇个数为3的效果最好.齐鲁师范学院

本文发布于:2023-05-21 12:42:48,感谢您对本站的认可!

本文链接:http://www.035400.com/whly/3/418739.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:聚类   数据   算法   游记
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2024-2030 Comsenz Inc.Powered by © 文化旅游网 滇ICP备2022007236号-403 联系QQ:1103060800网站地图