国外的旅游网站

阅读: 评论:0

极乐汤碧云温泉馆-南京维景国际大酒店

国外的旅游网站
2023年4月10日发(作者:白洋淀二日游)

收稿日期:2021

02

02

基金项目:国家社会科学基金项目“用户参与的网络动态信息组织增城挂绿 模式研究”(项目编号:18BTQ071);郑州大学人文社会科学优秀青

年科研团队培育计划项目“用户参与的网络知识服务研究”(项目编号:2020

QNTD

09)。

作者简介:王娜(1979

),女,副教授,博士,硕士生导师,研究方向:信息组织与信息用户。董焕晴(1995

),女,硕士研究生,

研究方向:信息组织与信息用户。

信息组织与信息检索

用户参与的在线旅游网站信息本体构建研究

———以马蜂窝在线旅游网站为例

王 娜

1,2 董焕晴1

(1.郑州大学信息管理学院,河南郑州450001;2.郑州市数据科学研究中心,河南郑州450001)

摘 要:[目的/意义]为了使本体的构建和进化更为快捷便利,能够向用户提供语义关联性更强、更有价

值的信息,更好地满足用户对网络旅游信息的需求。[方法/过程]在梳理旅游本体构建研究成果的基础上,提

出了用户参与的在线旅游网站信息本体的构建方法,并利用七步法设计了在线旅游网站信息本体构建流程,最后

利用马蜂窝在线旅游网站中的数据对本文提出的构建本体的方法与效果进行了验证与分析。[结果/结论]实验

结果表明,采用网站中用户发布的信息可构建在线旅游网站信息本体,并且利用所构建的本体在一定程度上可为

用户提供更加全面、语义关系更丰富的信息,优化了用户的检索效果,验证了本文提出的构建本体方法的可行性

与优势。

关键词:用户;在线旅游;网站信息;本体构建;马蜂窝

DOI:10.3969/j.issn.1008

0821.2021.06.006

〔中图分类号〕G254 〔文献标识码〕A 〔文章编号〕1008

0821(2021)06

0064

12

ResearchonInformationOntologyConstructionofOnline

TourismWebsiteBasedonUserParticipation

———TakeHorseBeehiveOnlineTravelWebsiteasanExample

WangNa1,2 DongHuanqing1

(1.SchoolofInformationManagement,ZhengzhouUniversity,Zhengzhou450001,China;

2.ZhengzhouDataScienceResearchCenter,Zhengzhou450001,China)

Abstract:[Purpose/Significance]Thispaperaimstomaketheconstructionandevolutionofontologyfasterandmore

convenient,itcanprovideuserswithmoresemanticallyrelevantandvaluableinformation,andbettermeettheneedsofus⁃

ersforonlinetourisminformation.[Method/Process]Basedontheresearchoftourismontologyconstruction,theconstruc⁃

tionmethodofonlinetourismwebsiteinformationontologywithuserparticipationisproposed.Thentheconstructionprocess

ofonlinetourismwebsiteinformationontologybyusingsevenstepmethodwasdesigned.Finally,usingthedataofthehorse

beehiveonlinetravelwebsitetoverifyandanalyzethemethodandeffectofontologyconstruction.[Result/Conclusion]The

experimentalresultsshowedthattheinformationontologyofonlinetourismwebsitecanbeconstructedbyusingtheinforma⁃

tionreleasedbyusersinthewebsite,andtheconstructedontologycanprovideuserswithmorecomprehensiveandmorese⁃

manticinformationtoacertainextent,optimizetheretrievaleffectofusers.Andthefeasibilityandadvantagesoftheontol⁃

ogyconstructionmethodproposedinthispaperareverified.

Keywords:user;onlinetourismwebsiteinformation;ontologyconstruction;horsebeehive

—46—

2021年6月

第41卷第6期

现代情报

JournalofModernInformation

June,2021

Vol41 No6

随着经济以及旅游业的发展,旅游资源越来越

丰富,外出旅游也成为人们的日常休闲活动。网络

信息技术的不断进步和发展,让在线旅游获得了极

大的进展,在线旅游网站也因此层出不穷,如人们

常用的有马蜂窝旅游网、携程旅行网、途牛旅游

网、去哪儿旅行网等。面对旅游网站中大量的旅游

景区、美食、住宿等信息,人们通常是通过基于关

键词的查询方式获取信息,然后再筛选出真正满足

自身需求的信息加以利用。在互联网

旅游的模式

下,人们获取旅游信息资源的渠道增加,获取的网

络信息数量也随之增加,使其更易受到信息迷航或

信息过载的困扰。因此,如何将大量的信息进行合

理组织以便更贴近于用户的需求,使得用户在大量

嘈杂的数据中可以简便清晰地获取有价值的信息是

一个亟需解决的问题。

互联网的快速发展使得更多的用户从信息的使

用者渐渐转变为主动的内容生产者,这既使得网络

信息数量激增,又由于一手信息的丰富增强了信息

的时效性。因此,笔者认为为了使得获取的信息更

符合用户的需求,优化用户的检索效果,可利用用

户参与行为产生的信息来构建旅游信息本体,在本

体的基础上对旅游网站信息进行重新组织。该方法

的优势在于:首先,以用户发布的信息作为数据源

构建本体,一方面可以使获取的信息更贴合用户的

需求;另一方面可以使本体的进化变得更为自动

化,不用过多地依赖领域专家参与,只需每隔一段

时间爬取用户发布的信息即可完成更新。其次本体

主要定义了事物的概念、属性以及概念之间的关

系,能够体现出信息之间的关联性。将本体技术应

用于在线旅游网站的信息组织,能够将各个旅游信

息类之间的关系体现出来,在语义和知识层次上表

示复杂的知识

[1],比如当用户搜索某一景区时,网

站会将与景区相关联的美食、酒店、交通等信息以

及其自身的属性都反馈给用户,为用户提供更精确、

有价值、有关联的旅游信息。

1 国内外研究现状综述

11 国内外旅游本体构建相关研究综述

旅游本体是将本体技术应用于旅游领域,通过

对相关旅游概念的描述,构建概念间的逻辑关系,

国内外的学者在旅游本体构建方面也进行了大量的

研究。如闫晓鹏通过在旅游信息检索系统中引入本

体技术,以山东省为例,利用七步法构建了山东旅

游信息本体模型

[2]。封珏以扬州风景区为例研究

了其中的类结构,最后使用OWL本体描述语言定

义本体类、类之间的属性关系、属性的约束以及实

例的创建,构建了扬州领域旅游信息本体

[3]。戚

利娜为了提升旅游信息资源的检索效果,以张家界

为例,利用六步法研究了类的层次结构,最后使用

Protg工具构建了张家界旅游信息本体[4]。李艳

等以商洛地区为例,提出了基于本体的全域旅游信

息平台建设模式,并通过使用Protg工具构建了

商洛地区的全域旅游信息本体

[5]。李庆赛在比较

大众分类法与本体的异同上,采用七步法对旅游领

域本体建模,并在此基础上使用本体构建工具

Protg详细介绍了旅游本体的构建过程[6]。Chan⁃

trapornchaiC等以泰国健康旅游为例,通过信息收

集、语料库研究、本体的构建和发布评价以及应用

构建等过程,构建了泰国第一个健康旅游本体

[7]。

XavierCC等提出了利用半自动化的抽取方法提取

数据库的类别,其主要过程为逐步抽取旅

游分类结构、类别的层级结构、概念关系、子类和

实例,进而以此为基础最终构建旅游信息本体

[8]。

MiliH等结合本体构建工具Protg和OWL本体语

言构建了一个法语旅游本体,为构建的电子旅游平

台系统提供了基础框架

[9]。DaramolaJO等在构建

尼日利亚旅游业的旅游推荐服务框架时,利用本体

构建工具Protg和OWL语言构建了目的地环境本

体和住宿本体

[10]。

12 简要述评

综上所述,国内外对于旅游信息本体构建研究

已有一定的成果,目前的研究大多集中在通过使用

某一地区的旅游信息进行本体的构建。但尚未有从

用户的角度出发,利用在线旅游网站中用户发布的

信息进行本体构建的研究。将用户在在线旅游网站

发布的信息重新组织应用,能够在较大程度上满足

用户自身的需求,并更好地体现出信息的时效性价

值,而本体作为一种有效的知识组织方式景山元宵节封山 ,能够帮

助用户在大量的信息之间简便快速地获取有价值的

关联信息。因此,本文在借鉴现有旅游信息本体构

建研究相关成果的基础上,以在线旅游网站中用户—56—

2021年6月

第41卷第6期

用户参与的在线旅游网站信息本体构建研究www.xdqb.net

June,2021

Vol41 No6

发布的信息为切入点,从用户的角度出发构建在线

旅游网站信息本体。

2 用户参与的在线旅游网站信息本体设计

21 用户对旅游信息组织的需求分析

在线旅游网站是用户通过互联网进行互通和分

享旅游信息的网络平台。随着旅游活动的日常化,

在出行前,越来越多的用户习惯于从在线旅游网站

中获取相关的景区、美食、住宿以及交通等信息。

因此,为了了解用户使用在线旅游网站的现状,本

文调研了马蜂窝旅游网、携程旅行网、途牛旅游网

等相关在线旅游网站的产品体验分析报告

[11

13],

以此为基础分析了目前用户对于在线旅游网站的需

求,在分析过程中发现有4个方面容易影响到用户

满意度:第一,虽然网络技术的普及让人们获取信

息变得容易,但网络信息的增长量超出了用户的认

知能力,造成了信息过载等诸多问题。而目前在线

旅游网站只提供了简单的关键词查询、分类搜索等

检索方法,展示的游记、攻略和旅游产品信息过

多,导致页面之间的交互复杂需要跳转多个界面进

行查询,已无法使用户快速获取有价值的旅游信

息;第二,旅游领域中信息的复杂性强,涉及游、

购、娱、食、住、行等多方面,再加上各个在线旅

游网站面向的用户体阶层也有所不同,如马蜂窝

旅游网的用户大多为25~35岁的年轻女性,而携

程旅行网、途牛旅游网的用户则东京散步 较多为35岁左右

的商务男性。因此,不同的用户在查询信息时,需

要查询多次或者尝试多个在线旅游网站才能够获取

全面的信息,单个的网站难以满足用户全面的信息

需求;第三,用户在通过查看相关游记获取旅游信

息时,因为大部分游记是由图文以及视频组成,在

获取相关信息时,一般都要看完视频或者阅读完整

篇内容才能获取其中的零星信息,所得到的信息也

较为分散、关联性弱,并且需要花费较多时间浏览

和阅读;第四,从互联网技术方面来说,在线旅游

网站提供的搜索引擎对语义的理解和表达有限,往

往会造成信息的检准率低和信息之间语义关联性差

的问题。

基于以上分析,为了提高用户对于获取的信息

的满意程度,笔者认为可采用用户参与构建在线旅

游网站信息本体的方法,从用户的角度出发,以用

户发布的信息为基础使用本体方式对在线旅游网站

中的信息进行组织,构建一个可重用、可发展的在

线旅游网站信息本体,提供更有关联的、更满足用

户需求的信息。

22 用户参与的在线旅游网站信息本体设计机理

通过上文的分析可知,随着在线旅游网站的发

展,大量繁杂的网络信息不仅没有很好地满足用户

的需求,反而降低了用户获取有价值旅游信息的效

果。针对此问题,本文提出一种以用户发布的旅游

信息为基础,通过用户参与构建在线旅游网站信息

本体的方法,以期通过基于本体的查询来优化用户

检索信息的效果,使得检索的结果更加满足用户需

求。在本研究中用户参与的方式主要是在在线旅游

网站中的信息发布行为,发布的信息包括游记、攻

略、评论等多种内容,也即在本体构建过程中用户

的参与是一种隐式的参与,该种方式可减轻用户的

负担。用户参与的在线旅游网站信息本体设计机理

具体如图1所示,其整个流程主要包括用户数据的

生成、用户数据的获取、在线旅游网站信息本体构

建、旅游信息检索4个模块。

1)用户数据的生成。该部分是指用户通过在

线旅游网站发布旅游游记、攻略、评论等信息,组

成了网站中有关于用户的大量旅游信息文本集,对

这些信息中的相关内容进行挖掘可用于后续的本体

构建,这一部分是整个用户参与的在线旅游网站信

息本体构建的数据基础。

2)用户数据的获取。第一步是利用数据采集

工具爬取在线旅游网站中用户发布的文本信息,然

后进行文本信息的筛选,筛选标准是剔除爬取到的

重复、乱码以及含有错误的文本。第二步是将经过

预处理的文本信息利用分词系统进行分词以及关键

词的提取。第三步是将提取出的关键词依据词语的

词性以及词频进行筛选,主要是过滤没有意义的虚

词和实词,选取词性为名词且出现频次相对较高的

关键词,然后将内容或意义相同但名称不同的词汇

进行归类或合并,最后以词频进行排序形成在线旅

游网站用户旅游信息数据集。

3)在线旅游网站信息本体构建。综合相关研

究得出,目前常用的本体构建方法主要包括IDEF5

[14]、TOVE法、METHONLOGY法、骨架法和七

—66—

2021年6月

第41卷第6期

现代情报

JournalofModernInformation

June,2021

Vol41 No6

图1 用户参与的在线旅游网站信息本体设计机理

步法。它们的成熟度依次为七步法>METHONLOGY

法>IDEF5法>TOVE法>骨架法

[15]。其中IDEF5

法、TOVE法和骨架法主要用于构建企业领域本体,

METHONLOGY法通常用于创建化学领域本体,七

步法是基于本体开发工具Protg构建领域本体,是

目前一种较为实用也较为成熟的本体构建方法

[16]。

因此,本文认为可采用七步法构建用户参与的在线

旅游网站信息本体,以获取的在线旅游网站用户旅

游信息数据集作为主要数据源,并以在线旅游网站

分类类目信息、中国旅游资源分类表为参考,对提

取的旅游信息的相关概念以及概念间的关系进行分

析,确定旅游领域的核心术语、定义类和类之间的

等级体系、定义类的属性、创建本体实例,最后形

成在线旅游网站信息本体库。

4)旅游信息检索。该部分是指用户使用构建

的在线旅游网站信息本体库进行旅游信息的检索,

本体库将一系列具有语义关联的旅游信息返回给用

户。

3 用户参与的在线旅游网站信息本体构建

31 用户参与的在线旅游网站信息本体基础模型

设计 在旅行中旅游者的实际旅游需求包含吃、住、

行、游、购、娱6大方面,考虑到构建在线旅游网

站信息本体的实用意义,本文借鉴了旅游体验的6

大要素吃、住、行、游、购、娱,并在分析了国内

各大优秀旅游网站的主题导航信息的基础上,提炼

出在线旅游网站信息本体的6大核心类:景区、美

食、住宿、交通、娱乐、购物,其中每一个核心类

中又包含诸多的子类,可以逐步细化到每一个具体

的实例。因此,本文以此为基础构建了在线旅游网

站信息本体的基础模型,如图2所示。

图2 在线旅游网站信息本体基础模型

32 用户参与的在线旅游网站信息本体构建流程

构建在线旅游网站信息本体是为了实现知识的

共享与重用,但信息是在不断改变和增长的,因而

本体也是不断进化、逐步完善的。所以本体构建的

流程要有一定的可复用性,鉴于此,本文在七步法

和在线旅游网站信息本体基础模型的基础上,提出

了用户参与的在线旅游网站信息本体的具体构建流

程。具体构建流程如下所示:

321 确定领域本体的范围

—76—

2021年6月

第41卷第6期

用户参与的在线旅游网站信息本体构建研究www.xdqb.net

June,2021

Vol41 No6

在构建本体时首先要明确的是本体覆盖的专业

领域,本文以旅游领域作为特定的研究领域,从用

户角度出发,挖掘在线旅游网站中用户发布的相关

旅游信息,并以此为基础构建在线旅游网站信息本

体。

322 考察复用现有本体的可能性

根据对现有相关本体的研究,发现目前国内外

学者的研究大多是针对某一地区或者某一旅游要素

构建本体,与本文的研究目标有所不同,所以不考

虑复用现有的本体。

323 选取旅游信息概念术语

本文将会以获取的在线旅游网站用户旅游信息

数据集作为构建旅游信息本体的主要数据源,然后

参考在线旅游网站中有关的旅游实例信息以及中国

旅游资源分类表信息,确定选取的旅游信息概念术

语。

324 定义类和类的等级体系

本文采用自顶向下法来构建本体,以前文构建

的6大顶层核心类为基础,在参考在线旅游网站分

类类目信息与中国旅游资源分类表的基础上,划分

各大核心类子类。考虑到类的通用性与科学性,定

义类的层级结构,具体如图3所示。

图3 在线旅游网站信息本体层次分类图

325 定义类的属性及关系

此部分是描述类的内在结构的过程,属性的建

立通常是以学科知识和应用目的为基础,其包括对

象属性和数据属性。类的对象属性主要表示旅游信

息本体中类之间的关系,类的数据属性表示的是类

实例对象所具有的特征,比如住宿具有价格、星级

等属性。

1)定义类的关系,其主要表示旅游信息本体

中类与类之间、类与实例之间、实例与实例之间的

关系,本文定义的关系主要包括part

of、kind

of、

instance

of和attribute

of4种。本文主要参考在线

旅游网站分类类目信息与中国旅游资源分类表,定

义类之间的关系。比如景区、美食、住宿、交通、

娱乐、购物6个大类是总的旅游信息类的一部分,

可用part

of表示;景区与人文景区、自然景区则

是父类与子类的关系,可用kind

of表示;某具体

的人文景区与人文景区之间则是类与实例的关系,

可用instance

of表示。

2)定义类的对象属性,其主要是对领域内各

种类的关系进行描述,比如景区类与美食类之间可

用have_food的对象属性进行关联,表示的是景区

周边存在的美食信息。本文通过各旅游网站对旅游

领域内相关景区、美食、住宿、交通、娱乐、购物

信息的分析归纳,定义了旅游信息本体中类的对象

属性,如表1所示。

表1 在线旅游网站信息本体的对象属性

属性名称属性描述

have_food景区和美食的关系,表示某个景区或

其周围有餐馆、美食

have_hotel景区和住宿的关系,表示某个景区或

其周围的住宿信息

have_transport景区和交通的关系,表示某个交通方

式可到达某个景区

have_shopping景区和购物的关系,表示某个景点或

其周围有购物场所

have_entertainment景区和娱乐的关系,表示某个景点或

者其周围有娱乐场所

nearby_scenic表示景区周围的景点

have_relation表示与景区有关联的信息,如历史典

故、人物信息

—86—

2021年6月

第41卷第6期

现代情报

JournalofModernInformation

June,2021

Vol莲塘 41 No6

3)定义类的数据属性,其表示的是一个类的

特征,用于对类的实例属性进行赋值。为了能够准

确和详细地描述类,在构建数据属性的时候,应该

重点关注属性的作用,考虑属性的科学性与适用

性,非关键的属性可以省略,例如在对景区、美食

等描述时,用户的关注点通常会在地址、价格上,

而对于景区、美食的创始人姓名关注较少。通过调

研分析在线旅游网站的分类类目的具体信息以及互

联网上对景区、美食、住宿、交通、娱乐、购物6

个大类实例的具体描述,本文定义了6大分类中较

为通用的数据属性。定义的详细数据属性如下所

示:景区(营业时间、地址、、景点级别、

价格、简介),美食(营业时间、地址、、

人均消费、简介),住宿(营业时间、地址、联系

电话、房价、房型),交通(运营时间、、

费用信息),娱乐(营业时间、地址、、

内容介绍、费用信息),购物(营业时间、地址、

)。对于类的数据属性的取值,考虑到爬

取的用户发布的数据可能存在不准确和不完整的情

况,因此,本文在定义各个实例的属性的取值时,

将会以定义的实例为关键词重新搜索实例的相关信

息,然后将获取到的属性值根据定义的数据属性进

行赋值。

326 定义属性的分面

一个属性的分面就是指属性取值的特征,如取

值的类型、个数和容许的取值等。一个属性可能由

多个分面组成,它们共同构成属性的内在结构。比

如景区具有地址、、价格等属性,通常设

置“地址”属性取值类型为文本型、“”

取值类型为数字型,针对不同的旅游对象体,景

区“价格”属性通常会设置1~3个价格数值。

327 创建实例

实例是领域本体中最小的概念,比如从在线旅

游网站用户发布的信息中抓取的关键词就是一个个

的实例。在创建实例时,可选取在线旅游网站中某

一具体目的地,根据6大顶层核心类构建各个类的

具体实例。

328 本体形式化

目前,国内外开发构建本体的工具有很多,比

较成熟的有Protg系列、OntoEdit、WebODE等,

这些工具都是基于Web的本体描述语言,具有良

好的可扩展性,可以处理多种建立于Web之上的

本体描述语言格式

[17]。其中Protg系列是美国斯

坦福大学医学院生物信息研究中心基于Java语言

开发的本体构建工具,主要用于语义网中本体的构

建。它提供了本体概念普洱天气 类、关系、属性和实例的构

建,用户使用时只需在概念层次上进行领域本体模

型的构建,而不需要关心具体的本体描述语言

[18]。

由于其具有开源、支持中文编辑、简单易懂以及良

好的可扩展性等优势,因此本文将使用Protg工

具实现在线旅游网站信息本体的形式化。

329 本体知识库的存储

本体构建完成后,可以根据Protg工具提供

的RDF/XMLSyntax、OWL/XMLSyntax、TurtleSyn⁃

tax等保存方式进行本体文件的保存,用户可以在

保存后的本体内查询与维护此本体。

4 实证研究

41 在线旅游网站信息本体的概念及体系结构设计

本文以马蜂窝在线旅游网站为例,以洛阳为关

键词,使用后羿采集器数据采集工具爬取在线旅游

网站中用户发布的有关洛阳的游记信息,收集的信

息内容主要包括用户关于洛阳景区、美食、住宿、

交通、娱乐、购物等的描述信息。对爬取到的游记

文本内容处理的详细过程如下:

1)对爬取的文本信息进行筛选,剔除爬取到

的重复、乱码以及含有错误的文本,共计得到的洛

阳游记文本信息857条,部分详细文本信息如图4

所示。然后将筛选过的文本信息集使用NLPIR

IC⁃

TCLAS汉语分词系统的关键词提取功能进行分词

以及词频统计,部分结果如图5所示。

2)处理关键词分词结果,过滤没有意义的虚

词和实词等,如“虽然”“可以”“一个”“开始”

“建筑”等,然后保留词性为名词且出现频次相对

较高的关键词。其次是将内容或意义相同但名称不

同的词汇进行归类或合并,如“天子驾六”与“天

子驾六博物馆”“古墓博物馆”与“洛阳古代艺术

博物馆”等。

3)将其按词频进行降序排序得到关键词词频

统计结果,部分结果如图6所示。

—96—

2021年6月

第41卷第6期

用户参与的在线旅游网站信息本体构建研究www.xdqb.net

June,2021

Vol41 No6

图4 部分洛阳游记文本信息

图5 部分洛阳游记文本信息分词结果

图6 部分洛阳旅游信息关键词词频结果

4)根据得到的关键词词频统计结果,本文参

考中国旅游资源分类表,以其分类信息为标准,对

得到的关键词结果进行分类、归纳以及词频排序,

得到的部分景区类的关键词词频统计图与归纳的各

分类部分实例表,如图7与表2所示。

图7 部分洛阳景区类关键词及词频

5)定义类的属性及关系

①类的对象属性及关系的构建:类的关系的创

建主要以中国旅游资源分类信息为基准,类的对象

属性的创建主要根据前文335中对类的对象属性

的定义,其对象属性值的填充则是通过归纳汇总在

线旅游网站对各旅游实例的具体描述。以景区实例

为例,对其添加对象属性及关系,得到的实例信息

如表3和表4所示。

②类的数据属性与属性值的获取:依据上文定

义的数据属性,以洛阳旅游分类实例表中的各种实

例为关键词展开搜索,用搜索获取的具体信息填充

其属性值。本文以景区实例为例,进行实例数据的

添加,部分实例具体数据如表5所示。

42 基于Protg的在线旅游网站信息本体构建

依照上文中定义的本体构建流程,选用上文中

定义的类、类的属性与属性值,使用Protg进行—07—

2021年6月

第41卷第6期

现代情报

JournalofModernInformation

June,2021

Vol41 No6

表2 洛阳旅游各类部分实例表(按频次降序排列)

类二级类实 例

景区

人文景区

龙门石窟、白马寺、丽景门、少林寺、洛邑古城、香山寺、西山石窟、关林庙、古墓博物馆、东

山石窟、白园、天子驾六博物馆、明堂、国际牡丹园、鼓楼、二里头遗址、鸡冠洞、万佛洞、古

阳洞、隋唐城遗址植物园、潜溪寺、文峰塔、天王殿等

自然景区香山、龙潭大峡谷、白云山、小浪底、金鸡河等

美食

正 餐牛肉汤、羊肉汤、牡丹燕菜、火锅、汤肉片、驴肉、牛肉等

小 吃鲜花饼、锅贴、鸡蛋灌饼、胡辣汤等

交通

短途交通地铁、公交车、出租车、三轮车、电瓶车

长途交通火车、飞机、大巴、高铁、驾车

娱乐

室内娱乐伏牛山滑雪场、武术表演、演出、展厅

室外娱乐温泉、摄影

购物

纪念品唐三彩、汉服、纹饰、其他纪念品

其他物品衣服、化妆品、茶

表3 景区类关系及实例信息

概 念关联概念关 系关 系 描 述

景 区

人文景区kind

of人文景区类是景区类的子类

自然景区kind

of自然景区类是景区类的子类

龙门石窟西山石窟、东山石窟part

of西山石窟与东山石窟属于龙门石窟的一部分

人文景区洛邑古城instance

of人文景区类与具体的实例之间的关系

表4 白马寺实例对象属性及属性值

类关联类对象属性属 性 值

白马寺(景区)

景区nearby_scenic白马寺周边景区有清凉台、观音阁

美食have_food白马寺周边餐饮有九多肉多、双龙水席园

住宿have_hotel白马寺周边住宿有洛阳万泉宾馆、白马宾馆

交通have_transport白马寺周边交通方式有驾车、56路和58路公交

购物have_shopping白马寺周边购物场所有家兴超市、丹尼斯超市

本体的创建。

1)定义类:根据上文定义的类目在Class界

面添加其顶层类及二级类,并构建它们之间的层次

结构,得到的本体类目层次结构图如图8所示。

2)定义属性:根据上文定义的对象属性与数

据属性,分别通过ObjectProperty与DataProperty

界面添加定义类的对象属性与数据属性,如图9和

图10所示。

3)添加洛阳旅游信息本体实例:在使用Protg

为在线旅游网站信息本体添加实例时,本文以洛阳

表5 白马寺景区实例数据

属 性属 性 值

营业时间7:40~18:00

地 址河南省洛阳市洛龙区洛白路6号

0379

63781065

价 格联票:35元人民币(周一至周日)

景点级别河南省洛阳市国家AAAA级旅游景区

出现频次1595次

简 介

白马寺始建于东汉永平十一年(公元68

年),是佛教传入我国后由官府建造的寺

院……

—17—

2021年6月

第41卷第6期

用户参与的在线旅游网站信息本体构建研究www.xdqb.net

June,2021

Vol41 No6

表5(续)

属 性属 性 值

其 他

免票人:14米(含)以下儿童;70

岁(含)以上老人;残疾人凭残疾证、

军人凭军官证……

图8 类目层次结构图

旅游信息为例,以上文爬取整理后的实例及实例数

据填充本体。首先是为建立的类目下添加相应的实

例,其次是为实例添加对应的对象属性值与数据属

性值。具体如图11所示。

图9 在线旅游网站信息本体类对象属性

图10 在线旅游网站信息本体类数据属性

图11 实例对象属性值与数据属性值添加界面

4)本体可视化:本文使用Protg的OntoGraf

功能,实现构建的本体的可视化。如图12和图13

所示,其中虚线表示的是各类目之间、各实例之间

的语义联系,其中图13表示的是展开的龙门石窟

实例的相关信息。

—27—

2021年6月

第41卷第6期

现代情报

JournalofModernInformation

June,2021

Vol41 No6

图12 在线旅游网站信息本体可视化

图13 在线旅游网站信息本体可视化展开图

43 用户参与的在线旅游网站信息本体评估

431 实验过程

为了对用户参与的在线旅游网站信息本体进行

评估测试,本文采用用户参与的方式进行实验,具

体的实施步骤为:

1)选取10位用户作为实验用户,然后依据已

构建完成的本体,让用户从中选择感兴趣的景点。

2)将从实验用户处搜集到的景点作为第一次

检索的关键词,然后使用其分别在在线旅游网站信

息本体和在线旅游网站中进行检索,并分别将本体

检索结果集和网站检索结果集汇总。

3)将本体检索结果集和网站检索结果集分别

以推送的方式返回给用户,并请用户选择结果集中

感兴趣的信息作为第二次检索的检索词,然后使用

其分别在在线旅游网站信息本体和在线旅游网站中

进行检索,最后分别将两次检索的本体检索结果信

息和网站检索结果信息汇总。

4)将汇总后的本体检索结果集和网站检索结

果集以推送的方式重新返回给用户,并请用户依据

满意度评估量表对检索结果集进行评价。

5)统计10位用户的评估结果,对评估结果

进行均值化处理,最后以此为基准来评估用户参与

的在线旅游网站信息本体的效果。

432 评估量表设计

在设计用户满意程度评估五级李克特量表时,

本文以莫祖英等

[19]

提出的信息资源质量维度划分

中的检索结果的检全率和检准率两个指标,查先进

[20]

提出的信息资源质量评估指标体系中的易用

性、可获取性和准确性3个指标以及OntoQA

[21]

化指标评估框架中的模式指标组的关系丰富度、属—37—

2021年6月

第41卷第6期

用户参与的在线旅游网站信息本体构建研究www.xdqb.net

June,2021

Vol41 No6

性丰富度两个评估指标作为参考。综合对以上3类

指标分析,得出本文适用的具体评估指标为信息的

全面性、信息的精确性、有效信息的易获取性、信

息的关联性、信息的准确性。其中信息的全面性是

指检索结果集所反映的信息是否全面;信息的精确

性是指检索结果集反映的信息是否精确,是否为应

该检索出的信息;有效信息的易获取性是指返回的

检索结果集能否帮助用户更快更简易地获取有效信

息;信息的关联性是指检索结果集中除了返回检索

词本身的具体信息,是否返回与其相关的其他旅游

信息以及其具体内容;信息的准确性是指检索结果

集的质量,比如信息的来源是否可靠、返回的信息

是否有错误等。在对量表题目选项进行赋值时,设

置非常不同意为1分、比较不同意为2分、一般为

3分、比较同意为4分、非常同意为5分,具体的

用户满意程度评估量表题目设置如表6所示。

表6 用户满意程度评估五级李克特量表

1我认为与网站检索的结果进行对比,本体检索结果集中反映的信息更全面

A非常不同意 B比较不同意 C一般 D比较同意 E非常同意

2我认为与网站检索的结果进行对比,本体检索结果集中反映的信息更精确

A非常不同意 B比较不同意 C一般 D比较同意 E非常同意

3我认为与网站检索的结果进行对比,本体检索结果集中能更容易到需要的信息

A非常不同意 B比较不同意 C一般 D比较同意 E非常同意

4我认为与网站检索的结果进行对比,本体检索结果集中反映的信息更容易理解

A非常不同意 B比较不同意 C一般 D比较同意 E非常同意

5我认为与网站检索的结果进行对比,本体检索结果集中推荐的有用的信息更多

A非常不同意 B比较不同意 C一般 D比较同意 E非常同意

6我认为与网站检索的结果进行对比,深圳口碑网 本体检索结果集中反映的与景点有关的其他旅游信息更多,如景点的附近的

美食、住宿、交通、购物、历史人物、历史信息

A非常不同意 B比较不同意 C一般 D比较同意 E非常同意

我认为与网站检索的结果进行对比,本体检索结果集中反映的景点以及与其有关的其他旅游信息的内容更多、更

丰富,如展示景点的附近的美食、住宿等信息的内容更多、更丰富

A非常不同意 B比较不同意 C一般 D比较同意 E非常同意

8我认为与网站检索的结果进行对比,本体检索结果集中反映的信息错误更少,比如错别字、错误信息

A非常不同意 B比较不同意 C一般 D比较同意 E非常同意

433 实验结果分析

对统计结果进行分析,经过处理后的检索结果

满意度分值如表7所示。当平均值结果为3~4分,

代表用户对本体检索结果集中反映的信息比较满

意;当平均值结果为4~5分,代表用户对本体检

索结果集中反映的信息非常满意。

从上述满意度反馈数据可以发现,与通过网站

检索获取的检索结果集相比,用户对于使用本体检

索出的检索结果集满意程度更好。如数据显示,在

检索的信息的全面性、信息的精确性、有效信息的

易获取性、信息的关联性、信息的准确性5个方面,

表7 检索结果集分值对比结果

评估指标本体检索结果集分值

信息的全面性42

信息的精确性36

有效信息的易获取性397

信息的关联性435

信息的准确性34

平均值3904

与在线旅游网站对比,用户对于利用在线旅游网站

信息本体检索出来的信息较为满意。尤其是在信息

—47—

2021年6月

第41卷第6期

现代情报

JournalofModernInformation

June,2021

Vol41 No6

的全面性和信息的关联性这两个方面用户的满意程

度更高,其次是有效信息的易获取性方面。经过上

述分析可知,本文采用用户参与构建在线旅游网站

信息本体的方式对信息进行重新组织,在一定程度

上使得用户获取的信息更加全面以及获取的信息之

间的语义关系更丰富。因此,本文认为基于用户参

与的在线旅游网站信息本体可为用户提供更有关

联、更满足用户需求的信息。

5 结 语

随着人们生活水平的不断提高,旅游逐渐成为

其休闲娱乐的方式,而人们获取相关旅游攻略信

息,往往要浏览在线旅游网站上大量的旅游景区波兰首都 、

美食、住宿等信息,然后再进行筛选和归纳,利用

信息的效率还有待提高。针对该问题,本文从用户

的角度出发,提出用户参与的在线旅游网站信息本

体的构建方法,并利用马蜂窝中用户发布的关于洛

阳的旅游信息进行了实证分析,实验结果说明当用

户使用此种方式进行旅游信息查询时,获得的检索

结果更加全面以及获取的结果之间的语义关系更丰

富,因而使其获得了更有价值的旅游攻略信息,优

化了用户的检索效果。但是由于时间等诸多原因,

本文的研究尚存在以下不足:一方面是在实证过程

中,本文仅爬取了马蜂窝在线旅游网站的数据,数

据量较小,因而得到的相关旅游信息还存在偏差;

另一方面是本文的研究内容尚处于基础性的阶段,

总体框架比较简单,仍需进一步完善。因为非旅游

相关专业,对于数据内容的处理容易出现偏差,一

定程度上影响了构建的本体的准确性,所构建的本

体库尚不完善,因而在构建本体的过程中需要相关

旅游专业的人员指导。这两点也是后续研究中需进

一步完善的地方。

参考文献

[1]李晓瑛,李军莲,冀玉静,等.基于叙词表及其语义关系的本

体构建研究[J].情报科学,2018,36(11):83

87.

[2]闫晓鹏.基于山东省的旅游本体构建研究[J].信息技术与信

息化,2019,(9):178

180.

[3]封珏.基于扬州的旅游本体构建研究[J].信息与电脑:理论

版,2018,(3):12

15.

[4]戚利娜.基于张家界的旅游本体构建研究[J].科技创新与应

用,2018,(28):76

78.

[5]李艳,赵玉霞.基于本体的全域旅游信息平台[J].系统仿真

技术,2018,14(3):172

176.

[6]李庆赛.旅游领域本体构建研究[D].郑州:郑州大学,2015.

[7]ChantrapornchaiC,ChoksuchatC.OntologyConstructionandAp⁃

plicationinPracticeCaseStudyofHealthTourisminThailand[J].

SpringerPlus,2016,5(1):2106.

[8]XavierCC,LimaVLS.ASemi

automaticMethodforDomain

OntologyExtractionfromPortugueseLanguageWikipediasCatego⁃

ries[M].AdvancesinArtificialIntelligence

SBIA2010.Spring⁃

er,Berlin,Heidelberg,2011:11

20.

[9]MiliH,ValtchevP,CharifY,etal.E

TourismPortal:ACase

StudyinOntology

DrivenDevelopment[C]//InternationalCon⁃

ferenceonE

Technologies.Springer,Berlin,Heidelberg,2011:

76

99.

[10]DaramolaJO,AdigunMO,AyoCK.BuildinganOntology

BasedFrameworkforTourismRecommendationServices[C]//

ENTER,2009:135

147.

[11]谭丹.旅游APP用户体验调查研究———以携程旅行为例

[EB/OL].https://wenku.baidu.com/view/076141c911a6f524cc

bff121dd36a32d7275c70d.html,2020

10

25.

[12]Nairo.蚂蜂窝“旅游攻略”App竞品分析[EB/OL].http://

www.woshipm.com/evaluating/140203.html,2020

10

25.

[13]Kangman.途牛旅游APP产品体验分析[EB/OL].https://

www.jianshu.com/p/0448ff6f1434,2020

10

25.

[14]GruberTR.ATranslationalApproachtoPortableOntologies[J].

KnowledgeAcquisition,1993,5(2):199

220.

[15]李景,孟连生.构建知识本体方法体系的比较研究[J].现

代图书情报技术,2004,(7):17

22.

[16]尚新丽.国外本体构建方法比较分析[J].图书情报工作,

2012,56(4):116

119.

[17]马苗苗,陈春辉.基于Protg的交通地理本体构建方法[J].

北京测绘,2019,33(12):1566

1570.

[18]HadzicM,ChangE.Ontology

BasedSupportforHumanDisease

Study[C]//HawaiiInternationalConferenceonSystemSciences.

IEEE,2005:143

151.

[19]莫祖英,马费成.数据库信息资源内容质量用户满意度模型

及实证研究[J].中国图书馆学报,2013,39(2):85

97.

[20]查先进,陈明红.信息资源质量评估研究[J].中国图书馆

学报,2010,36(2):46

55.

[21]TartirS,ArpinarIB,MooreM,etal.OntoQA:Metric

Based

OntologyQualityAnalysis[C]//IEEEICDM2005Workshopon

KnowledgeAcquisitionfromDistributed,Autonomous,Semanti⁃

callyHeterogeneousDataandKnowledgeSources.IEEE,2005.

(责任编辑:陈 媛)

—57—

2021年6月

第41卷第6期

用户参与的在线旅游网站信息本体构建研究www.xdqb.net

June,2021

Vol41 No6

本文发布于:2023-04-10 20:30:48,感谢您对本站的认可!

本文链接:http://www.035400.com/whly/4/50723.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

上一篇:飞扬旅行社
下一篇:春节旅游攻略
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2024-2030 Comsenz Inc.Powered by © 文化旅游网 滇ICP备2022007236号-403 联系QQ:1103060800网站地图