双一流高校数字人文研究现状与知识图谱构建

阅读: 评论:0

双一流高校数字人文研究现状与知识图谱构建#
龙泉1〃
〔1.武汉大学图书馆;2.科技大数据湖北省重点实验室(中国科学院武汉文献情报中心),
湖北武汉430000〕
[摘要]分析我国双一流高校数字人文研究现状,把握整体研究水平和研究模式,以推动跨 机构、跨学科数字人文研究和项目建设。以中国知网上收录的42所双一流高校参与撰写的数字 人文主题论文为研冗对象,采用文献计量方法、VOSviewer和CiteSpace软件评估其发展阶段、发文 期刊、学科背景、作者合著模式和主要研究团体、机构合作模式和热点研究主题。揭示双一流高 校数字人文研究的3个发展阶段、3个主流研究方向、13个研究主题;挖掘研究的主要传播渠道、基础学科背景和应用领域;构建作者合著网络、机构合作网络、关键词聚类时间分布图谱。
[关键词]双一流高校数字人文知识图谱
[分类号]G250
北斗地图1研究背景
数字人文起源于人文计算,可追溯至20世纪 60年代,始于利用计算机技术对意大利文学作品 进行语言和文字处理'后随着文学、历史、艺术、音乐等人文学科的扩展,各类技术如超文本、超媒 体、数据可视化、信息检索、数据挖掘、统计、文本 挖掘等的应用,逐渐改变了传统人文学科的研究 方式,数字人文也成为计算机与人文学科学习、研 究、发明以及创新的新兴跨学科研究领域。
全球多个国家及高校建立了数字人文中心或 联盟,如欧洲于丨973年和1978年成立了关于文 学、语言、计算机领域数字人文研究的组织;加拿 大于1986年成立数字人文联合会;美国国家人文 基金会和马里兰大学于2007年建立国际数字人文 网络CenterNet。国内学者对数字人文的关注度亦 不断提升。2011年,武汉大学成立了大陆地区首 家数字人文研究中心,并于2018年9月加人Cen-研究主题合作模式
terNet ;2014年6月,上海市图书馆学会举行2014 年图书馆前沿技术论坛“数字人文与语义技术”专 题研讨会;2016年5月,北京大学图书馆联合哈佛 大学“中国历代人物传记资料库(CBDB)”项目和 北京大学“数字人文建设与发展研究课题组”共同 举办了首届北京大学“数字人文论坛”,邀请国内 外专家对数字人文在文史、艺术等方面的应用进 行探讨和交流,该论坛已经举办了 3届;2016年5 月,中国人民大学清史研究所召开“数字人文与清 史研究”学术工作坊;2017年7月1-2 H南京大学 召开“数字人文:大数据时代学术前沿与探索”学 术研讨会,涉及地理、历史、统计学、资讯科学、建 筑、经济、文学、艺术等多个学科;2017年12月,深 圳大学城图书馆主办了“数字人文与图书馆”国际 研讨会,来自英
国、美国及国内的数字人文专家从 不同角度就数字人文研究及图书馆在其中的作用 进行了广泛探讨;2019年7月,敦煌研究院和中国 社会科学情报学会数字人文专业委员会主办了
$本文系科技大数据湖北省重点实验室(中H科学院武汉文献情报中心)开放基金课题资助项目“科研人员研究行为及成果知 识图谱分析”(项目编号:20KF011010)、湖北省高校图工委科研基金研究项目“图书馆大数据分析及可视化挖掘的应用研究”(项目编号:2017-YB -01)的研究成果。
“敦煌(DH2019)文化遗产数字化国际研讨会暨中 _社会科学情报学会数字人文专委会学术年会”,会议围绕文化遗产数字化、人文社科智慧数据建 设与管理,文化遗产知识图谱构建与应用等8个议 题展开讨论;2019年10月,北京大学人文社会科学 研究院等联合主办的“数字人文视角下的典籍传 承与学科融合论坛”召开,各高校介绍了在数字人
文领域现有的成果积累,研讨数字人文的发展。
随着信息技术不断发展,越来越多学科与计 算机科学交叉融合,数字人文研究方兴未艾。通
过文献计量学、可视化技术分析我国双一流高校 数字人文研究现状,了解其研究内容、研究作者及 机构,揭示其发展趋势、演化路径,有助于把握整 体研究水平和研究模式,聚焦研究热点,对推动跨 机构、跨学科数字人文项目建设有重要意义。
张家界天门山玻璃栈道图片
2数据来源及研究方法
2.1数据来源
去欧洲旅游哪家旅行社
“双一流”是世界一流大学和世界一流学科建 设的简称,在2017年9月公布的名单中,有42所高 校被纳入世界一流大学建设|21。笔者以这42所高 校为调研对象,在中国知网以“数字人文”或“人文 计算”为主题,即限定为题名、关键词、摘要字段,机构限定为以各高校名开头的名称,发表时间截 至2019年12月31日,进行检索。检索时间为2020 年2月15日,得到“双一流”高校作者参与撰写的 相关主题文献共246篇,占总篇数793篇的31%, 去掉学位论文、报纸来源、主持人的话、主编的话 等以及个別作者缺失的题录后,最终得到226篇, 作为研究对象=
2.2研究方法
笔者采用文献计量学、知识图谱可视化方法 进行研究。采用EXCEL统计了 226篇论文的发表 时间、研究机构分布、发文期刊类型及发文量,了解研究整体情况;通过逐篇阅读对论文进行分类 分析,识别主流研究方向;采用VOSviewer进行作 者合著网络分析,识别合著模式和主要研究团体; 采用CiteSpace进行机构合作网络分析和关键词聚 类演化时间线分析,识别机构合作模式、机构关系、热点研究主题及时间分布。
3双一流高校数字人文研究现状
3.1年度发文量分析
中国知网上收录以“数字人文”或“人文计算”为主题词,“双一流”高校作者参与撰写的论文各 年份发文量及增长幅度如表1所示。
表1“双一流”高校数字人文研究年度发文量年份文章数增长幅度(%>
20061~
200910.00
201210.00
20133200.00
20146100.00
20155-16.67
201613160.00
201739200
20187382.50
20198415.07
最早的一篇论文发表于2006年,为数字人文 研究起步阶段,探讨了技术与人文融合的利弊|31; 2007—2012年间,并未迎来领域研究的快速发展 阶段,只有2篇研究成果,研究内容为技术或项目 介绍,为数字人文研究的探索阶段,该领域此时并 未受到广泛关注;2013—2019年,经历从成长过渡 到快速发展的阶段,每年均有成果发表,在数量上 基本呈逐年增多态势,近3年已有一定数量积累,2019年达到84篇,且在研究内容上更多元化,包括 国内外调研、研究进展等理论研究,也有基于技 术、项目实践的具体经验探索。
3.2发文机构分析
42所双一流高校中,有33所参与数字人文主 题的研究,占比78.6%。其中,综合类高校20所,占比最高,为60.6%,其次为理工类高校8所,占比 24.2%,另有师范类、民族类、军事类、农林类高校 亦有参与。
从机构类型上看,笔者对226篇文献作者机构 进行统计,结果显示:包括合著在内的所有作者共
来自195家机构,其中院系、研究中心、实验室共 142家,占比72.8%;图书馆35家,占比17.9%;以
一 级机构“大学”为发文机构的共14家,占比7.2%; 公司5家,占比2.6%。进一步对其中双一流高校 数据进行统计:双一流高校机构共136家,其中院 系、研究中心、实验室共101家,占比74.3%;图书 馆25家,占比18.4%;以一级机构“大学”为发文机 构的共9家,占比6.6%;出版社/公司共2家,占比 1.5%。可见,有专业学科背景的研究机构是从事 数字人文研究的主体,其次,图书馆对该领域亦表 现出一定程度的关注。
从机构发文量及学科背景看,将二级机构汇 总至其所属一级机构后,排名前三的一级机构为:南京大学(47篇)、武汉大学(27篇)、北京大学(22 篇);排名前三的二级机构为:南京大学信息管理 学院(29篇)、武汉大学信息管理学院(23篇)、中国 人民大学信息资源管理学院(13篇)。发文总量排 名前十的一级、二级机构如表2所示。
数字人文研究是跨学科研究,除了要拥有历 史、人文、教育等不同学科知识和研究基础外,还 需掌握数据的搜集、处理、分析等信息技术手段。从一级机构看,发文量排名前10的除华东师范大 学外,均为综合类高校,表明学科门类丰富的高校 产出了更多研究成果,原因或为其多学科优势,且 校内院系、研究中心等机构之间便于开展交流合 作,研究人员有更多机会接触并学习不同的专业 知识,具备从事跨学科研究的意愿和有利条件。
同时,根据教育部学位与研究生教育发展中 心最新公布的第四轮学科评估结果|41,发文量排名 前10
的14所大学均开设了信息科学相关专业,其 中有8所拥有图书情报与档案管理类一级学科,且 南京大学、武汉大学、中国人民大学将该学科评估 为A类;有13所拥有管理科学与工程一级学科,且 清华大学、上海交通大学、浙江大学、四川大学、东 南大学将该学科评估为A类。进一步分析排名前 10的16所二级机构类型,有8所为信息科学类院 系或研究中心,5所为图书馆,3所为文史学院或文 学研究所。据此可知,双一流高校中从事数字人 文研究的机构较为集中,主要为信息科学相关学 科类型,该学科包含信息组织与管理、数据和文本 的分析与挖掘、信息可视化等研究方向,具备技术 优势,也是其他专业人员从事数字人文研究的有
表2发文量排名前10的一级、二级机构
排名_级机构发文量排名二级机构发文量1南京大学471南京大学信息管理学院29 2武汉大学272武汉大学信息管理学院23
3北京大学223中国人民大学信息资源管理学院13 4中国人民大学194北京大学信息管理系10 4华东师范大学195华东师范大学图书馆9
国内租车哪个平台比较好
5浙江大学146武汉大学信息资源研究中心8
6中山大学127北京大学图书馆7
7上海交通大学117南京大学历史学院7
8清华大学98中山大学资讯管理学院6
9吉林大学78吉林大学管理学院6
9四川大学79上海交通大学图书馆5
9山东大学79山东大学历史文化学院5 10东南大学510浙江大学图书馆4
江西上饶
10复旦大学510
华东师范大学
经济与管理学部信息管理系
4
10浙江大学外国文学研究所4
10中山大学图书馆4
效助力。95种。按CSSCI、核心期刊、“CSSCI+核心期刊”和3.3发文期刊分析 普通期刊四类进行分类,各类期刊种数、发文篇数3.3.1发文期刊类型分析 及占比、平均发文量见表3所示。
发表双一流高校作者数字人文研究的期刊共
表3发文期刊种数、发文篇数及占比
期刊种数种数占比(%)发文篇数发文篇数占比(%)平均发文量CSSCI1212.62310.18  1.9
核心期刊3  3.27  3.10  2.3 CSSCI+核心期刊4951.614664.60  3.0普通期刊3132.65022.121.6合计95100.0226100.00  2.4
从发文期刊的种数及篇数占比来看,“CSSCI+ 核心期刊”类是双一流高校作者主要发文渠道,且 近80%的作者在CSSCI或核心期刊上发文,论文整 体质量较高,或因双一流高校的教学条件、人员科 研能力、职称评定等各项指标对此产生的影响3进一步按年份统计,各类期刊发文量逐年变 化趋势如下图1所示。
图1各类型期刊年度发文趋势
从年份变化来看,近5年为数字人文研究快速 发展期,其中“CSSCI+核心期刊”的发文量大幅度 跃升,
是拉动数据上升的关键因素。表明“双一 流”高校近年来不断重视数字人文领域研究,研究 数量增加,研究质量显著提高。
3.3.2期刊所属学科分析
中国知网收录的期刊按所属学科分成不同专 辑及不同专题,95种期刊共涉及7个不同专辑(4 种期刊未标明专辑,只计入总数未列入表中;1种 期刊同属两个专辑计2次),各专辑、专题的期刊种 数及占比如表4所示。
可见,占比排名第一的信息科技类期刊是数 字人文研究发表的主要阵地,共51种,占比 53.7%。其下属专题图书情报与数字图书馆类期刊亦在总种数中占比最高,共36种,占比39.6%。且该类期刊发文量达135篇,占总发文量(226篇)的比例高达59.7%,说明数字人文研究除了研究机 构集中,研究成果的主要类型也相对集中。
占比第二的为社会科学II类期刊,共17种,占比17.9%,其下属专题教育综合类期刊在总种数中 亦排名第二,共16种,占比17.6%。同时,在这16 种期刊中,有10种为人文、哲学类学报,可见双一 流高校对数字人文研究有一定支持力度,且该研 究的跨学科特性也在信息科学与人文社会科学的 融合中得到体现。
对期刊发文量进一步分析,发文量排名前10 的14种期刊中,12种为图书情报与数字图书馆类;发文量超过平均值2.4篇的期刊有25种,具体如表 5所示。
由表5可见,发文量相对较高的期刊几乎都为 信息科技类期刊,主要集中于图书情报与数字图 书馆、档案及博物馆两类。反映了 :(1)数字人文 研究较多涉及信息处理及分析方法,发文期刊类 型与上一节机构分析中得出的研究人员主要为信 息科学相关专业相符的结论一致;(2)档案及博物 馆类期刊在期刊总种数中占比并不高,但发文量 却较高,一方面说明该类期刊对数字人文研究的 支持力度,另一方面说明,除图情领域外,档案及 博物馆领域的研究人员对数字人文的理论与方法 亦颇为熟悉,且两个领域交叉、互通较多,有助于 研究框架与知识结构的不断完善,北京郊野公园排名
也更易积累研
表4各学科期刊种数及占比
专辑名称专题名称期刊种数种数所占百分比(%)基础科学(3种,占比3.2%)基础科学综合3  3.3
工程科技IK2种,占比2.2%)建筑科学与工程2  2.2
哲学与人文科学 (17 种,占比 17.9%)美术书法雕塑与摄影11.1史学理论11.1
世界文学11.1文化11.1文史哲综合5  5.5
文艺理论11.1戏剧电影与电视艺术11.1中国古代史11.1
中国通史11.1
中国文学4  4.4
社会科学1(1种,占比1.1%)行政学及国家行政管理11.1
社会科学II (17 种,占比 17.9%)教育综合1617.6中等教育11.1
信息科技(51 种,占比 53.7%)
出版3  3.3档案及博物馆77.7计算机软件及计算机应用11.1图书情报与数字图书馆3639.6新闻与传媒4  4.4
经济与管理科学(1种,占比1.1%)企业经济11.1
表5发文量超过平均值以上的期刊
期刊名称发文量期刊名称发文量期刊名称发文量图书馆论坛23数字图书馆论坛4档案与建设3图书馆杂志12图书馆4江海学刊3大学图书馆学报11图书馆理论与实践4情报理论与实践3情报资料工作9图书馆学刊4山西档案3山东社会科学8文化研究4图书馆学研究3中国图书馆学报8创新科技3图书情报知识3
上海高校图书情报工作研究7大学图书情报学刊3浙江档案3图书情报工作7档案学通讯3
图书与情报6档案学研究3
究经验与成果。
3.4研究影响力分析
论文被引频次是学术评价的指标之一,也代 表了该研究在业内的被认可度、学术影响力和学 术价值。
中国引文数据库中所有机构的数字人文 研究论文被引篇数为645篇,被引总次数为3469 次,平均被引5.38次;双一流高校的数字人文论文被引篇数为153篇,被引总次数为1125次,平均被 引7.35次。说明“双一流”高校数字人文研究数量 不多,影响力较整体平均水平略高,但优势不明 显。
同时,笔者统计了被引频次高于7.35次的论 文,共得到108篇。其中,“双一流”高校作者参与 撰写的有36篇,占比33.3%; “双一流”高校作者为

本文发布于:2023-05-21 03:41:52,感谢您对本站的认可!

本文链接:http://www.035400.com/whly/1/418020.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:研究   人文   数字   期刊
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2024-2030 Comsenz Inc.Powered by © 文化旅游网 滇ICP备2022007236号-403 联系QQ:1103060800网站地图