用户参与的在线旅游网站信息本体构建研究——以马蜂窝在线旅游网站为例

阅读: 评论:0

收稿日期:2021-02-02
基金项目:国家社会科学基金项目 用户参与的网络动态信息组织模式研究 (项目编号:18BTQ071);郑州大学人文社会科学优秀青年科研团队培育计划项目 用户参与的网络知识服务研究 (项目编号:2020-QNTD-09)㊂
作者简介:王娜(1979-),女,副教授,博士,硕士生导师,研究方向:信息组织与信息用户㊂董焕晴(1995-),女,硕士研究生,研究方向:信息组织与信息用户㊂
㊃信息组织与信息检索㊃
用户参与的在线旅游网站信息本体构建研究
以马蜂窝在线旅游网站为例
王㊀娜1,2㊀董焕晴1
(1.郑州大学信息管理学院,河南郑州450001;2.郑州市数据科学研究中心,河南郑州450001)
摘㊀要:[目的/意义]为了使本体的构建和进化更为快捷便利,能够向用户提供语义关联性更强㊁更有价值的信息,更好地满足用户对网络旅游信息的需求㊂[方法/过程]在梳理旅游本体构建研究成果的基础上,提出了用户参与的在线旅游网站信息本体的构建方法,并利用七步法设计了在线旅游网站信息本体构建流程,最后利用马蜂窝在线旅游网站中的数据对本文提出的构建本体的方法与效果进行了验证与分析㊂[结果/结论]实验结果表明,采用网站中用户发布的信息可构建在线旅游网站信息本体,并且利用所构建的本体在一定程度上可为用户提供更加全面㊁语义关系更丰富的信息,优化了用户的检索效果,验证了本文提出的构建本体方法的可行性与优势㊂
关键词:用户;在线旅游;网站信息;本体构建;马蜂窝DOI:10.3969/j.issn.1008-0821.2021.06.006 中图分类号 G254㊀
文献标识码 A㊀
文章编号 1008-0821(2021)06-0064-12
ResearchonInformationOntologyConstructionofOnlineTourismWebsiteBasedonUserParticipation
TakeHorseBeehiveOnlineTravelWebsiteasanExample
WangNa1,2㊀DongHuanqing1
(1.SchoolofInformationManagement,ZhengzhouUniversity,Zhengzhou450001,China;
2.ZhengzhouDataScienceResearchCenter,Zhengzhou450001,China)
Abstract:[Purpose/Significance]Thispaperaimstomaketheconstructionandevolutionofontologyfasterandmoreconvenient,itcanprovideuserswithmoresemanticallyrelevantandvaluableinformation,andbettermeettheneedsofus⁃ersforonlinetourisminformation.[Method/Process]Basedontheresearchoftourismontologyconstruction,theconstruc⁃tionmethodofonlinetourismwebsiteinformationontologywithuserparticipationisproposed.Thentheconstructionprocessofonlinetourismwebsit
einformationontologybyusingsevenstepmethodwasdesigned.Finally,usingthedataofthehorsebeehiveonlinetravelwebsitetoverifyandanalyzethemethodandeffectofontologyconstruction.[Result/Conclusion]Theexperimentalresultsshowedthattheinformationontologyofonlinetourismwebsitecanbeconstructedbyusingtheinforma⁃tionreleasedbyusersinthewebsite,andtheconstructedontologycanprovideuserswithmorecomprehensiveandmorese⁃manticinformationtoacertainextent,optimizetheretrievaleffectofusers.Andthefeasibilityandadvantagesoftheontol⁃ogyconstructionmethodproposedinthispaperareverified.
Keywords:user;onlinetourismwebsiteinformation;ontologyconstruction;horsebeehive
46 2021年6月
第41卷第6期
现代情报
JournalofModernInformation
June,2021
Vol 41㊀No 6
㊀㊀随着经济以及旅游业的发展,旅游资源越来越丰富,外出旅游也成为人们的日常休闲活动㊂网络信息技术的不断进步和发展,让在线旅游获得了极大的进展,在线旅游网站也因此层出不穷,如人们常用的有马蜂窝旅游网㊁携程旅行网㊁途牛旅游网㊁去哪儿旅行网等㊂面对旅游网站中大量的旅游景区㊁美食㊁住宿等信息,人们通常是通过基于关键词的查询方式获取信息,然后再筛选出真正满足自身需求的信息加以利用㊂在互联网+旅游的模式下,人们获取旅游信息资源的渠道增加,获取的网络信息数量也随之增加,使其更易受到信息迷航或信息过载的困扰㊂因此,如何将大量的信息进行合理组织以便更贴近于用户的需求,使得用户在大量嘈杂的数据中可以简便清晰地获取有价值的信息是一个亟需解决的问题㊂
互联网的快速发展使得更多的用户从信息的使用者渐渐转变为主动的内容生产者,这既使得网络信息
数量激增,又由于一手信息的丰富增强了信息的时效性㊂因此,笔者认为为了使得获取的信息更符合用户的需求,优化用户的检索效果,可利用用户参与行为产生的信息来构建旅游信息本体,在本体的基础上对旅游网站信息进行重新组织㊂该方法的优势在于:首先,以用户发布的信息作为数据源构建本体,一方面可以使获取的信息更贴合用户的需求;另一方面可以使本体的进化变得更为自动化,不用过多地依赖领域专家参与,只需每隔一段时间爬取用户发布的信息即可完成更新㊂其次本体主要定义了事物的概念㊁属性以及概念之间的关系,能够体现出信息之间的关联性㊂将本体技术应用于在线旅游网站的信息组织,能够将各个旅游信息类之间的关系体现出来,在语义和知识层次上表示复杂的知识[1],比如当用户搜索某一景区时,网站会将与景区相关联的美食㊁酒店㊁交通等信息以及其自身的属性都反馈给用户,为用户提供更精确㊁有价值㊁有关联的旅游信息㊂
1 国内外研究现状综述
1 1㊀国内外旅游本体构建相关研究综述
旅游本体是将本体技术应用于旅游领域,通过对相关旅游概念的描述,构建概念间的逻辑关系,国内外的学者在旅游本体构建方面也进行了大量的研究㊂如闫晓鹏通过在旅游信息检索系统中引入本体技术,以山东省为例,利用七步法构建了山东旅游信息本体模型[2]㊂封珏以扬州风景区为例研究了其中的类结构,最后使用OWL本体描述语言定义本体类㊁类之间的属性关系㊁属性的约束以及实例
的创建,构建了扬州领域旅游信息本体[3]㊂戚利娜为了提升旅游信息资源的检索效果,以张家界为例,利用六步法研究了类的层次结构,最后使用Protégé工具构建了张家界旅游信息本体[4]㊂李艳等以商洛地区为例,提出了基于本体的全域旅游信息平台建设模式,并通过使用Protégé工具构建了商洛地区的全域旅游信息本体[5]㊂李庆赛在比较大众分类法与本体的异同上,采用七步法对旅游领域本体建模,并在此基础上使用本体构建工具Protégé详细介绍了旅游本体的构建过程[6]㊂Chan⁃trapornchaiC等以泰国健康旅游为例,通过信息收集㊁语料库研究㊁本体的构建和发布评价以及应用构建等过程,构建了泰国第一个健康旅游本体[7]㊂XavierCC等提出了利用半自动化的抽取方法提取数据库的类别,其主要过程为逐步抽取旅游分类结构㊁类别的层级结构㊁概念关系㊁子类和实例,进而以此为基础最终构建旅游信息本体[8]㊂MiliH等结合本体构建工具Protégé和OWL本体语言构建了一个法语旅游本体,为构建的电子旅游平台系统提供了基础框架[9]㊂DaramolaJO等在构建尼日利亚旅游业的旅游推荐服务框架时,利用本体构建工具Protégé和OWL语言构建了目的地环境本体和住宿本体[10]㊂
1 2㊀简要述评
综上所述,国内外对于旅游信息本体构建研究已有一定的成果,目前的研究大多集中在通过使用某一地区的旅游信息进行本体的构建㊂但尚未有从用户的角度出发,利用在线旅游网站中用户发布的信息
进行本体构建的研究㊂将用户在在线旅游网站发布的信息重新组织应用,能够在较大程度上满足用户自身的需求,并更好地体现出信息的时效性价值,而本体作为一种有效的知识组织方式,能够帮助用户在大量的信息之间简便快速地获取有价值的关联信息㊂因此,本文在借鉴现有旅游信息本体构建研究相关成果的基础上,以在线旅游网站中用户
56
2021年6月第41卷第6期用户参与的在线旅游网站信息本体构建研究
www.xdqb.net
June,2021
Vol 41㊀No 6
发布的信息为切入点,从用户的角度出发构建在线旅游网站信息本体㊂
2 用户参与的在线旅游网站信息本体设计
2 1㊀用户对旅游信息组织的需求分析
在线旅游网站是用户通过互联网进行互通和分
享旅游信息的网络平台㊂随着旅游活动的日常化,在出行前,越来越多的用户习惯于从在线旅游网站中获取相关的景区㊁美食㊁住宿以及交通等信息㊂因此,为了了解用户使用在线旅游网站的现状,本文调研了马蜂窝旅游网㊁携程旅行网㊁途牛旅游网等相关在线旅游网站的产品体验分析报告[11-13],以此为基础分析了目前用户对于在线旅游网站的需求,在分析过程中发现有4个方面容易影响到用户
满意度:第一,虽然网络技术的普及让人们获取信息变得容易,但网络信息的增长量超出了用户的认知能力,造成了信息过载等诸多问题㊂而目前在线旅游网站只提供了简单的关键词查询㊁分类搜索等检索方法,展示的游记㊁攻略和旅游产品信息过多,导致页面之间的交互复杂需要跳转多个界面进行查询,已无法使用户快速获取有价值的旅游信息;第二,旅游领域中信息的复杂性强,涉及游㊁购㊁娱㊁食㊁住㊁行等多方面,再加上各个在线旅游网站面向的用户体阶层也有所不同,如马蜂窝旅游网的用户大多为25 35岁的年轻女性,而携程旅行网㊁途牛旅游网的用户则较多为35岁左右的商务男性㊂因此,不同的用户在查询信息时,需要查询多次或者尝试多个在线旅游网站才能够获取全面的信息,单个的网站难以满足用户全面的信息需求;第三,用户在通过查看相关游记获取旅游信息时,因为大部分游记是由图文以及视频组成,在获取相关信息时,一般都要看完视频或者阅读完整篇内容才能获取其中的零星信息,所得到的信息也较为分散㊁关联性弱,并且需要花费较多时间浏览和
阅读;第四,从互联网技术方面来说,在线旅游网站提供的搜索引擎对语义的理解和表达有限,往往会造成信息的检准率低和信息之间语义关联性差的问题㊂
基于以上分析,为了提高用户对于获取的信息的满意程度,笔者认为可采用用户参与构建在线旅游网站信息本体的方法,从用户的角度出发,以用户发布的信息为基础使用本体方式对在线旅游网站中的信息进行组织,构建一个可重用㊁可发展的在线旅游网站信息本体,提供更有关联的㊁更满足用户需求的信息㊂
2 2㊀用户参与的在线旅游网站信息本体设计机理
通过上文的分析可知,随着在线旅游网站的发
展,大量繁杂的网络信息不仅没有很好地满足用户的需求,反而降低了用户获取有价值旅游信息的效果㊂针对此问题,本文提出一种以用户发布的旅游信息为基础,通过用户参与构建在线旅游网站信息本体的方法,以期通过基于本体的查询来优化用户检索信息的效果,使得检索的结果更加满足用户需求㊂在本研究中用户参与的方式主要是在在线旅游网站中的信息发布行为,发布的信息包括游记㊁攻略㊁评论等多种内容,也即在本体构建过程中用户的参与是一种隐式的参与,该种方式可减轻用户的负担㊂用户参与的在线旅游网站信息本体设计机理具体如图1所示,其整个流程主要包括用户数据的生成㊁用户数据的获取㊁在线旅游网站信息本体构建㊁旅游信息检索4个模块㊂
1)用户数据的生成㊂该部分是指用户通过在
线旅游网站发布旅游游记㊁攻略㊁评论等信息,组成了网站中有关于用户的大量旅游信息文本集,对这些信息中的相关内容进行挖掘可用于后续的本体构建,这一部分是整个用户参与的在线旅游网站信息本体构建的数据基础㊂
2)用户数据的获取㊂第一步是利用数据采集工具爬取在线旅游网站中用户发布的文本信息,然后进行文本信息的筛选,筛选标准是剔除爬取到的重复㊁乱码以及含有错误的文本㊂第二步是将经过预处理的文本信息利用分词系统进行分词以及关键词的提取㊂第三步是将提取出的关键词依据词语的词性以及词频进行筛选,主要是过滤没有意义的虚词和实词,选取词性为名词且出现频次相对较高的关键词,然后将内容或意义相同但名称不同的词汇进行归类或合并,最后以词频进行排序形成在线旅游网站用户旅游信息数据集㊂
3)在线旅游网站信息本体构建㊂综合相关研究得出,目前常用的本体构建方法主要包括IDEF5法[14]㊁TOVE法㊁METHONLOGY法㊁骨架法和七
66 2021年6月
第41卷第6期
现代情报
JournalofModernInformation
June,2021
Vol 41㊀No 6
图1㊀用户参与的在线旅游网站信息本体设计机理
步法㊂它们的成熟度依次为七步法>METHONLOGY法>IDEF5法>TOVE法>骨架法[15]㊂其中IDEF5法㊁TOVE法和骨架法主要用于构建企业领域本体,METHONLOGY法通常用于创建化学领域本体,七步法是基于本体开发工具Protégé构建领域本体,是目前一种较为实用也较为成熟的本体构建方法[16]㊂因此,本文认为可采用七步法构建用户参与的在线旅游网站信息本体,以获取的在线旅游网站用户旅游信息数据集作为主要数据源,并以在线旅游网站分类类目信息㊁中国旅游资源分类表为参考,对提取的旅游信息的相关概念以及概念间的关系进行分析,确定旅游领域的核心术语㊁定义类和类之间的等级体系㊁定义类的属性㊁创建本体实例,最后形成在线旅游网站信息本体库㊂
4)旅游信息检索㊂该部分是指用户使用构建的在线旅游网站信息本体库进行旅游信息的检索,本体库将一系列具有语义关联的旅游信息返回给用户㊂
3㊀用户参与的在线旅游网站信息本体构建3 1㊀用户参与的在线旅游网站信息本体基础模型设计
㊀㊀在旅行中旅游者的实际旅游需求包含吃㊁住㊁行㊁游㊁购㊁娱6大方面,考虑到构建在线旅游网站信息本体的实用意义,本文借鉴了旅游体验的6大要素吃㊁住㊁行㊁游㊁购㊁娱,并在分析了国内各大优秀旅游网站的主题导航信息的基础上,提炼出在线旅游网站信息本体的6大核心类:景区㊁美食㊁住宿㊁交通㊁娱乐㊁购物,其中每一个核心类中又包含诸多的子类,可以逐步细化到每一个具体的实例㊂因此,本文以此为基础构建了在线旅游网站信息本体的基础模型,如图2所示
图2㊀在线旅游网站信息本体基础模型
3 2㊀用户参与的在线旅游网站信息本体构建流程构建在线旅游网站信息本体是为了实现知识的共享与重用,但信息是在不断改变和增长的,因而本体也是不断进化㊁逐步完善的㊂所以本体构建的流程要有一定的可复用性,鉴于此,本文在七步法和在线旅游网站信息本体基础模型的基础上,提出了用户参与的在线旅游网站信息本体的具体构建流程㊂具体构建流程如下所示:
3 2 1㊀确定领域本体的范围
76
2021年6月第41卷第6期用户参与的在线旅游网站信息本体构建研究
www.xdqb.net
June,2021
Vol 41㊀No 6
在构建本体时首先要明确的是本体覆盖的专业领域,本文以旅游领域作为特定的研究领域,从用户角度出发,挖掘在线旅游网站中用户发布的相关旅游信息,并以此为基础构建在线旅游网站信息本体㊂
3 2 2㊀考察复用现有本体的可能性
根据对现有相关本体的研究,发现目前国内外
学者的研究大多是针对某一地区或者某一旅游要素构建本体,与本文的研究目标有所不同,所以不考虑复用现有的本体㊂
3 2 3㊀选取旅游信息概念术语
本文将会以获取的在线旅游网站用户旅游信息数据集作为构建旅游信息本体的主要数据源,然后参考在线旅游网站中有关的旅游实例信息以及中国旅游资源分类表信息,确定选取的旅游信息概念术语㊂
3 2 4㊀定义类和类的等级体系
本文采用自顶向下法来构建本体,以前文构建
的6大顶层核心类为基础,在参考在线旅游网站分类类目信息与中国旅游资源分类表的基础上,划分各大核心类子类㊂考虑到类的通用性与科学性,定义类的层级结构,具体如图3所示㊂
图3㊀在线旅游网站信息本体层次分类图
3 2 5㊀定义类的属性及关系
此部分是描述类的内在结构的过程,属性的建
立通常是以学科知识和应用目的为基础,其包括对象属性和数据属性㊂类的对象属性主要表示旅游信息本体中类之间的关系,类的数据属性表示的是类实例对象所具有的特征,比如住宿具有价格㊁星级等属性㊂
1)定义类的关系,其主要表示旅游信息本体
中类与类之间㊁类与实例之间㊁实例与实例之间的关系,本文定义的关系主要包括part-of㊁kind-of㊁instance-of和attribute-of4种㊂本文主要参考在线旅游网站分类类目信息与中国旅游资源分类表,定义类之间的关系㊂比如景区㊁美食㊁住宿㊁交通㊁娱乐㊁购物6个大类是总的旅游信息类的一部分,可用part-of表示;景区与人文景区㊁自然景区则是父类与子类的关系,可用kind-of表示;某具体的人文景区与人文景区之间则是类与实例的关系,可用instance-of表示㊂
2)定义类的对象属性,其主要是对领域内各种类的关系进行描述,比如景区类与美食类之间可用h
ave_food的对象属性进行关联,表示的是景区周边存在的美食信息㊂本文通过各旅游网站对旅游领域内相关景区㊁美食㊁住宿㊁交通㊁娱乐㊁购物信息的分析归纳,定义了旅游信息本体中类的对象属性,如表1所示㊂
表1㊀在线旅游网站信息本体的对象属性属性名称属性描述
have_food景区和美食的关系,表示某个景区或其周围有餐馆㊁美食
have_hotel景区和住宿的关系,表示某个景区或其周围的住宿信息
have_transport景区和交通的关系,表示某个交通方式可到达某个景区
have_shopping景区和购物的关系,表示某个景点或其周围有购物场所
have_entertainment景区和娱乐的关系,表示某个景点或者其周围有娱乐场所nearby_scenic表示景区周围的景点
have_relation
表示与景区有关联的信息,如历史典故㊁人物信息
86 2021年6月
第41卷第6期
现代情报
JournalofModernInformation
June,2021
Vol 41㊀No 6

本文发布于:2023-05-05 13:53:34,感谢您对本站的认可!

本文链接:http://www.035400.com/whly/3/380691.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:信息   旅游   本体   网站   用户   构建   研究   进行
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2024-2030 Comsenz Inc.Powered by © 文化旅游网 滇ICP备2022007236号-403 联系QQ:1103060800网站地图