大数据技术论文篇1
新的时代孕育和产生新的事物,而新的事物需要新的思维来认识。从传统眼光来看,无限增长的海量数据庞杂无序,无疑给人们认识事物造成更多的负担和压力;而今天借助现代科学手段,大数据却成为一种对海量数据进行有效收集、分析和处理的新的技术方法。“大数据标志着人类在寻求量化和认识世界的道路上前进了一大步。过去不可计量、存储、分析和共享的很多东西都被数据化。拥有大量的数据……为我们理解世界打开了一扇新的大门。”那么,如何看待大数据与学术期刊之间的联系?如何将大数据具体运用到学术期刊的办刊中?如何从海量数据中发现规律,寻找隐藏在大数据中的办刊模式和趋势,揭示当下期刊面临的新形势、新特点以及未来可能的发展前景?这些都需要我们学术期刊的办刊人转变观念,要有大数据思维。大数据思维首先强调要有大数据的意识。意识影响或支配人的行为。具备大数据意识的人,能够更加重视大数据,更主动地去运用大数据。这种人即使自身不拥有数据,不具备分析和处理数据的专业技能,往往也能够借助社会提供的已有数据加以利用,从而极大地提高工作效率,甚至能够先人一步获得机遇。对于学术期刊编辑来说,由专业机构或网站开发的论文、引文检索等大型数据库,为确保稿件编辑质量、提高工作效率等就提供了很多便利条件。例如知网、维普、万方等专业期刊网站均有独立开发的数据库,目前多数学术期刊的编辑已将选择数据库作为审核投稿的必要程序。根据其检测的重合率结果来判断论文是否存在抄袭、剽窃等学术不端行为,可以快速有效地避免论文重发、学术侵权等问题。如果仅凭编辑审稿时的个人经验判断,这些往往是很难做到的。利用期刊所获取的作者投稿、读者订阅、刊文转载转引率、网传文章点击或下载量等方面的大量信息数据,通过分析其中的相关性作出预测,以便更有针对性地选择紧扣学术热点的论文选题,挖掘具有学术发展潜力的高被引作者,正不失为一条学术期刊办刊的新路径。大数据思维还强调数据的全面收集和利用。由于技术条件和认识手段等局限,传统的小数据思维往往注重通过抽样数据或典型数据的分析作出判断,在今天看来,其结论是难以保证全面可靠的。因此,大数据强调要全面地收集和占有数据,“要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本”。作为学术期刊来说,全面收集与期刊联系密切相关的数据,建立期刊自己相对独立完备的数据库,也是一条值得重视的办刊新路径。通过接收来稿、学术会议交流、网络搜索等多种渠道,学术期刊可以广泛收集相关数据,逐步建立作者信息库、审稿专家信息库、读者信息库、期刊资源库、学术咨询库等准大数据资源。对于大多数数据来说,其利用价值往往具有多重性,也就是说在一次利用之后还可能会因不同的分析处理而产生再次利用价值。当然,大数据思维也要注意避免对大数据的过度迷信,要避免唯数据化的倾向。大数据时代的信息传播既具有海量性而又呈现碎片化的特征,网络自媒体的兴盛也同时带来信息传播良莠不齐、真伪难辨的诸多负面因素。所以,面对来自网络的众多信息和各种数据库的庞大资源,学术期刊编辑应该更加强化自身的把关能力,而不能陷入对大数据的盲从,唯大数据马首是瞻。比如在核校稿件的引文时,编辑人员不可完全相信各种学术搜索数据库,必要时还是要尽可能找到原版著作或论文资料逐字查对。此外,有些期刊或期刊编辑动辄要求来稿篇幅须在1万字以上,或参考文献须在15个以上,或正文内容至少须有三部分,或正文各部分须有三级纲目,等等,这些都是数据过度迷恋症的典型症候。这种对数据的过度迷恋,只会促成形式主义的新八股论文,而对学术创新的促进毫无助益。
二、学术期刊的评价路径:数据化评价
大数据时代,评价体系标准逐渐由重视定性分析转向重视定量分析,数据化评价越来越成为流行的趋势。正如哈佛大学社会学教授加里•金所说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”在学术期刊评价方面,目前主要有中国社科院社会评价中心、南京大学社会科学评价中心、北京大学图书馆核心期刊评价中心三大评价体系。这些评价体系虽然在具体评价指标上各有侧重,不尽相同,但在趋向性上有明显一致的地方,就是均强调数据指标的考核评价。数据评价的一个重要指标是期刊刊发论文的转引率。所谓转引率,是指一篇后被其他公开引用的机率或频次。随着对数据化客观评价的重视,它正在成为越来越加重要的评价论文学术影响力的因素。国内的许多学术成果评奖,也在将论文转引率作为必要的评价指标。不仅如此,论文的转引率还成为衡量学术期刊办刊水平和学术影响力的重要因素,甚至有的期刊评价体系如南京大学社会科学评价中心的评价体系将其作为最主要的评价指标。当然,不同专业的期刊其转引率会存在明显差距,如自然科学期刊的转引率相比较社会科学期刊来说普遍要高,社会科学期刊中经济学期刊相比较文学期刊来说又普遍较高。但对于同类期刊来说,通过努力是可以在原有自然转引的基础上使转引率得到明显提高的,同时可以达到提高期刊学术影响力的效果。[山东师范大学学报](人文社科版)近年来通过实施名家名稿战略,主动走出去向学术名家约稿,转引率有了较大幅度的提高。以北京大学资深教授、中国现代文学研究著名学者严家炎在该刊发表的[拓展和深化中国现代文学史研究的几个问题]为例,该文自发表以来,仅就CSSCI来源期刊来说,[中国现代文学研究丛刊][西南大学学报(社会科学版)][东岳论丛][山东社会科学][文学评论]等均有论文转引,此外还有许多普通期刊论文予以转引。名家的论文往往具有更高的学术性和创新性,容易产生影响力。当然,转引率的提升与期刊的多渠道推介和传播也有极大的关系。在当今期刊林立、信息海量涌现的大数据时代,如果不能主动推介、多渠道传播,那么即使是名家名稿也可能会被无情淹没在论文海洋中,为学界所忽略。数据评价的另一个重要指标是期刊刊发论文的转载率。所谓转载率,是期刊所发表的论文被其他刊物再次转发的比率。期刊每年被其他刊物转载的总篇数称为转载量,而转载篇数与期刊发文总量之比即为转载率。通过转载率或转载量,可以看出期刊论文获得社会和学界认可的程度,显示出期刊论文的学术影响和编辑水平。人大“复印报刊资料”可以说是国内影响较大的转载系列期刊,现有期刊100余种,每年从4000多种国内期刊、报纸上搜集、精选优秀的人文社科学术论文加以转载。目前,它已基本覆盖了我国人文社会科学所有一级学科。结合期刊转载,该复印书报资料中心每年还定期年度转载的学术论文数据,对我国人文社科期刊和教学科研机构进行统计排名。自2001年起每年3月份,[光明日报][中国新闻出版报][文艺报]、新浪网、搜狐网、中国网、中国高校人文社科网等媒体,都同时这个年度“转载排行榜”。该排行榜在一定程度上反映了我国人文社科期刊阵营和学术研究机构的发展状况,受到期刊界、教学科研机构和广大人文社会科学工作者的关注和重视。此外,[新华文摘][高等学校文科学术文摘][红旗文摘]等都是目前国内最主要的学术文摘期刊。作为期刊编辑,要想使自己编发的论文能被这些文摘期刊转载,获得较高转载率,当然首先应从提升论文的学术质量和水平上来努力。同时,利用大数据分析,从已有的转载论文情况以及各大转载期刊的转载要求,可以针对转载率作出必要的调整。例如人大“复印报刊资料”在转载评分数据的处理过程中,就有剔除会议消息、报道、书评等非学术性文章这样的原则要求。根据这样的分析结论,在发稿方面作必要调整,避免非学术性文章、学术性不强的文章、学术创新性不突出的文章等,则无疑会有更大可能提高所刊发论文的转载率。无论是转引率还是转载率,都只是定量分析数据评价的一方面内容,还很难称得上是全面客观的评价体系。从目前国内最具有影响的三大期刊评价体系来说,南京大学社会科学评价中心的CSSCI来源期刊评价体系更多侧重于转引率数据分析,北京大学图书馆的核心期刊评价体系更多侧重于转载率数据分析,中国社会科学院评价中心的人文社科核心期刊评价体系则兼顾到学科自引量、学科载文量、引文率、摘转率等多项评价指标,相对更加综合。因此,综合量化指标分析应是数据评价的发展趋势,学术期刊要想在数据评价方面得到优良成绩,不能只关注某一方面努力,而应在转引率、转载率等多项指标上综合发展。只有这样,才能切实提高学术期刊的综合实力,真正打造具有学术影响力的期刊。
三、学术期刊的传播路径:现代新媒体融合
大数据技术论文篇2
摘要:文章以2009年以来中国知网(CNKI)收录的主题为大数据和图书馆的论文为研究对象,运用文献计量学、系统分析法等方法,从文献量、作者、来源期刊分布、关键词、主题内容等方面,对大数据在图书馆学领域的研究现状进行评述,并探讨该主题在图书馆学领域的发展方向。
中图分类号:G250.7文献标识码:A文章编号:1003-1588(2014)12-0103-04
收稿日期:2014-10-20
作者简介:孙雨(1988-),金陵图书馆助理馆员。1数据来源及检索方法
为了研究我国目前图书馆学大数据的研究情况,笔者确定以中国知网(CNKI)[中国期刊全文数据库]为主要数据来源,配合[中国优秀硕士学位论文全文数据库][中国博士学位论文全文数据库][中国重要会议论文全文数据库]等数据库,对大数据的研究现状进行分析。
“大数据”概念在国内最早于2009年左右被提出[1],本文在检索时间上选取2009年1月至2014年6月期间发表的论文为研究数据。以“大数据”和“图书馆”为关键词进行检索,对结果进行文献总量分布情况、作者情况、关键词及主题进行统计分析,共计检索到203篇文献。
2文献量分析
为了准确反映该领域的研究水平、发展程度及课题活跃性,以半年为时间单位对文献量进行统计,结果如图1所示。可以看出,从2009年上半年的0篇到2014年上半年的85篇,总体文献量成激增状态,尤其是2012年开始,每个阶段的发文量都不断增加。
2009年至2012年上半年,与大数据有关的图书馆领域发文量相对较少,并且通过内容分析发现,这个阶段的文献只是与数据挖掘等数据处理技术相关的论文。虽然2009年“大数据”的概念被提出,但并没有立即引起图书馆界的重视。而从2012年开始,大数据的概念不断进入图书馆学研究者们的视野,发文量急剧增加,尤其是2013年下半年、2014年上半年。在此阶段,图书馆领域对于大数据的研究进入了一个增长点,可以预见,未来一段时间,大数据仍是我国图书情报学研究的重点与热点。
3作者分析
3.1核心作者分析
分析检索到的203篇文献,作者共有248人(其中有8篇文章无署名作者)。表1是作者的文献量情况,从中可以看出该领域发文篇数与人数的数量与比例。其中,发表1篇文献的作者数量所占比例达到95.56%,远远超过洛特卡定律[2]中提到的60%的比例,这表明现阶段我国研究该领域的人员比较分散,科学生产力还相对较低。
6主题分析
研究这203篇文献内容,可以发现,现阶段关于大数据在图书馆应用中的研究大体分为两个方面:图书情报学和计算机技术应用学。目前这两个领域,是研究大数据图书馆应用研究的核心领域。
“大数据”时代的到来最早是由全球知名咨询公司麦肯锡提出,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”[7]通过对203篇研究大数据在图书馆中应用的论文进行内容分析,可以发现研究方向主要分为以下几个方面。
6.1图书馆可用的大数据及来源
大数据伴随着互联网、云计算、物联网、社交网络等技术的兴起而呈指数级增长。在大数据时代,各种数据随时随处都在。而对于图书馆而言,“读者第一,服务至上”是永恒的主题,也是图书馆的立身之本,所以用户信息、服务信息等非结构化数据是主要收集对象。
另外,图书馆的数字化资源、网页和数据库等资源的读者访问数据以及社交媒体访问数据,甚至是RFID射频数据也构成了图书馆大数据的主要来源。正是这些大量的、多样的、高速发展的、具有真实性的数据,支撑起了图书馆大数据的主要组成部分。
6.2改变数据处理方式,提供创新服务
图书馆传统的数据处理方式是将纸质文献资源不断地进行数字化、网络化处理,并在原有资源的基础上,尽力满足用户的最大需求,使资源得到最大程度的利用。而大数据时代,图书馆的数据处理将发生极大的变化,如根据收集分析用户数据,对读者的借阅习惯、爱好、信息需求甚至社交方式等进行数据分析,提供针对性强、个性化的服务[8]。
同时,这也要求图书馆的部分传统业务,向数据挖掘、数据分析方向转变。随着需要处理的数据量增多,图书馆需要不断地提升数据分析处理的技术水平,从大量数据中挖掘出潜在的价值,才能不断地创新服务方式、提升服务水平。
6.3消除信息不平等
进入信息时代以来,信息不平等现象就一直存在。随着信息传播技术、传播渠道的不断发展,信息不平等现象不断地放大,大数据时代也不例外。由于不同地区、组织、机构以及个人在对数据收集分析使用中的信息差距,数据不平等是大数据时代呈现的最明显的信息不平等现象。
图书馆在应用大数据时,也应致力于消除信息不平等现象。图书馆可以通过维护发展公共图书馆制度、倡导社会责任与社会包容和提供公共智慧服务来消除数据不平等,维护大数据时代的信息公平[9]。
6.4保护用户隐私数据
大数据时代,图书馆为了能够有效地了解读者需求,需要通过处理平台对高速增长、结构复杂的数据进行采集、整理、归纳和分析。在这个过程中,被采集的用户数据包括个人隐私数据都会被全方位的监视与控制。如何保护海量用户隐私数据,也是众多学者研究的课题。
首先,图书馆必须自觉遵守相关法律法规,并制定相关规范,形成保护用户隐私的机制。其次,应提高用户隐私数据收集处理过程中的安全管理,并应致力于研究开发保护隐私的相关技术。最后,应加强培训员工保护用户隐私的意识,形成图书馆的自我约束和自我监督的氛围。只有这样,图书馆才能为读者提供大数据时代安全、高效、放心、满意的个性化服务[10]。
6.5大数据与新媒体营销
大数据时代的到来为图书馆的新媒体营销注入了活力。图书馆新媒体营销的运作核心是基于对内容与营销过程中积累的数据的分析,图书馆通过分析调研,掌握用户需求,并基于用户需求实时调整内容和营销模式。而支持新媒体能够对用户需求做出快速响应的,则是背后对用户和内容实时监控所形成的大数据。通过大数据挖掘和分析技术,图书馆新媒体可以随时调整其内容和营销策略,提高服务的精准度,让内容生产和营销模式层出不穷[11]。
7结语
通过对大数据在图书馆中应用的研究文章进行各种信息的分析,可以看出,大数据时代图书馆将会迎来服务营销方面新的发展机遇,但同时大数据也在数据安全方面给图书馆带来了挑战。
首先,大数据给图书馆带来了新的机遇。大数据环境下,图书馆可以通过分析海量数据,向用户提供针对性、个性化、专业化的服务,还可以根据用户需求,调整和改变图书馆营销模式,配合新媒体技术,吸引更多用户。
其次,大数据时代图书馆需要面对挑战。大数据时代的到来,图书馆需要处理大量高速增长的非结构化的用户数据。保护用户隐私数据,则是图书馆必须面对的问题。同时,图书馆也应致力于消除数据收集过程中的信息不平等现象,维护大数据时代的信息公平。
可以预见,一段时间内,大数据仍然是图书馆学领域研究的热门课题。随着相关研究的逐渐深入、参与研究的学者不断增多,相信大数据时代将给图书馆的发展带来更多的活力。
参考文献:
[1]百度百科.大数据[EB/OL].http:///subview/6954399/13647476.htm?fr=aladdin.
[2]百度百科.洛特卡定律[EB/OL].http:///view/40602.htm?fr=aladdin.
[3]沈奎林,杜瑾.Web2.0在图书馆应用方面研究论文的定量分析[J].现代情报,2010(10):140-143,154.
[4]百度百科.布拉福德定律[EB/OL]. http:///link?url=mJ2y3-NRa2QxPkYEQq3jq
2yfT2Vk3jFFDiLGHPsqrJV JMf7iaYmQI-P-tef
SaoDy.
[5]苏新宁.图书馆、情报与文献学研究热点与趋势分析(2000-2004)――基于CSSCI的分析[J].情报学报,2006(3):373-383.
[6]百度百科.大数据时代[EB/OL].http:///view/9424571.htm.
[7]杨海燕.大数据时代的图书馆服务浅析[J].图书与情报,2012(4):120-122.
[8]韩炜.大数据时代公共图书馆消除数据不平等的路径选择[J].图书馆论坛,2014(3):14-21.
[9]维克托・迈尔・舍恩伯格,肯尼思・库克耶,盛杨燕,周涛译.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2012.
[10]王薇.看互联网思维如何改变传媒业[J].媒介,2014(5):30-34.
大数据技术论文篇3
摘要:文章以CNKI期刊数据库收录的2008―2015年图书情报领域大数据相关论文为依据,利用文献计量方法,借助CiteSpaceIV,以绘制知识图谱的形式,对论文时间分布、期刊分布、高产作者分布以及研究热点(关键词)等进行分析,为今后国内学者对图书情报领域大数据深入研究提供参考。
中图分类号:G250文献标识码:A文章编号:1003-1588(2016)04-0129-04
1背景
大数据被称作是“信息时代的新石油”,大量数据正以每年50%的速度在增长,大数据已经成为图书情报学科领域研究的热点问题。笔者采用文献计量方法,以绘制知识图谱的形式,分别从文献、期刊、作者及关键词4个角度,分析近8年我国图书情报领域大数据的研究进展及未来发展趋势,期望能为该领域的相关研究者提供参考。
2研究方法
笔者采用文献计量方法对国内图书情报领域大数据研究发展现状进行分析,借助文献的各种特征,采用数学与统计学方法来描述、评价和预测该领域研究的现状与发展趋势。通过绘制科学知识图谱来反映国内图书情报领域大数据研究热点及发展趋势,可为该领域研究提供切实、有价值的参考。
2.1数据收集
笔者选取中国知网的中国学术期刊网络出版总库,检索式为:主题=大数据(精确匹配),学科类别为:图书情报与数字图书馆,检索时间:2008―2015年,期刊范围选取全部期刊,共得到论文1,080篇,经去重、剔除、整理后得到1,019篇。
2.2可视化工具
笔者使用由美国德雷塞尔大学陈超美教授开发的CiteSpace4.0R1版本进行分析,该软件在Java语言环境下运行,被广泛用于引文网络分析。利用CiteSpace分析国内图书情报领域大数据的研究现状、进展、前沿,试图从科学文献中发现其发展的新趋势和新动态。
2.3统计工具
笔者利用Excel软件,对通过中国知网检索到的有关图书情报领域大数据研究,时间段为2008―2015年的发文数量进行统计,以呈现国内图书情报领域大数据研究相关文献的时间分布趋势,并利用IBMSPSS进行曲线回归拟合分析,预测其发展趋势。基于文献计量方法,以CiteSpaceIV软件可视化的效果,分别对图书情报领域大数据研究的期刊分布、高产作者以及关键词等进行分析。
3我国图书情报领域大数据研究的时空知识图谱及其分析
3.1年代分布分析
文献计量分析方法中,从文献历时性上可以分析出学科的发展趋势,发文量的多少代表了在一定时期内该领域的研究的冷热程度。从图1所示的年代分布情况来看,国内图书情报领域大数据研究文献
数量(2015年文献数量只统计至11月份)整体上处于增长的趋势,呈现出一片繁荣景象。2008―2012年为该领域研究的起步探索阶段,5年所发文总量只有14篇,经分析这些文献,发现数据挖掘、数据仓储及语义网络是该阶段图情领域主要的研究内容,其为大数据研究奠定了基础。2012年以后,国内图书情报领域大数据发文量呈现爆炸式的增长态势,截至2015年11月,发文量已达522篇,学术成果丰硕,可见大数据在图情领域备受关注,已成为当前研究的热点。
回归分析法是通过试验和观测来推断变量之间的关系,并预测研究对象未来数量状态的统计分析方法。用IBMSPSS做曲线回归分析并进行拟合,同时选用多种曲线回归模型来进行拟合,拟合结果见表1和图2。
通过观察图2和表1,经比较可以确定出与原始观测值拟合度最好的是三次曲线模型,表达式为:y=16.857+3.113x-12.306x2+2.533x3。由此可预测,未来几年图书情报领域大数据研究文献数量将会呈现出增长趋势。总体上看,我国图书情报领域大数据研究已经积累了大量文献,随着该领域研究的持续发展,可以大胆预测未来几年该领域研究热度不会减,国内图情领域对大数据将进行更深入、更广泛的研究。
3.2来源期刊分布分析
为了解图书情报领域大数据研究的空间分布特点,并进一步为相关研究者深化对该领域研究提供情报源分布,有必要对有关图书情报领域大数据研究论文的来源期刊进行分析。根据布拉德福定律的区域分析法,将经计算,a值为4.4,确定的核心区期刊为10种,相关区期刊有44种,区期刊有198种(见表2)。从表2可以看出,核心区10种期刊发文342篇,占论文总数的33.57%;相关区44种期刊发文336篇,占论文总数的32.97%;区198种期刊发文341篇,占论文总数的33.46%。因此,总体上看,国内图书情报领域大数据研究文献的期刊分布基本符合布拉德福定律,呈现一种相对集中却又高度分散的特征。图书情报领域大数据研究的核心区期刊名称如表3所示,图书情报领域大数据研究的10种核心期刊中,6种是CSSCI来源期刊,2种是CSSCI扩展版来源期刊,这说明该领域大数据研究的集中程度较高,已经开始形成该领域研究的核心期刊群。
3.3高产作者知识图谱
由于发文量是衡量作者学术水平和科研能力的重要指标,高产作者对该领域发展及演变产生根本且深远的影响,因此对其研究具有重要意义。根据普莱斯定律,高产作者的论文下限为:M=0.749(Nmax)1/2,其中Nmax为最高产作者论文数。经IBMSPSS统计得知,马晓亭为最高产作者,其论文数为19篇,可得到M值为3.3,M取邻近最大整数为4篇。因此,将发文4篇以上(含4篇)的作者称为高产作者(由于篇幅有限,高产作者分布表未列出)。
为了更好地了解我国图情领域大数据研究的高产作者分布情况,在2008―2015年,以1年为时间段,取每年该领域研究发文数量最多的30位作者,经最小生成树算法修剪处理后,运行CiteSpaceIV软件,生成图书情报领域大数据研究发文作者的知识图谱。图中节点越大,表示该作者发文量越多,图中共有104个节点,27条连线,网络密度为0.005。结合由普莱斯定律确定的高产作者分布和图3可知,兰州商学院的马晓亭(19篇)和陈臣(14篇),桂林理工大学的张兴旺(10篇)和李晨晖(5篇),南京大学信息管理学院的苏新宁(6篇)、陈雅(6篇)和郑建明(5篇),武汉纺织大学管理学院的吴金红(6篇),中山大学资讯管理学院的黄晓斌(5篇),武汉大学信息资源研究中心的张斌(4篇),北京大学信息管理系的李广建(4篇)等为高产作者。总体上来看,高校图书馆员和专业教师仍是我国图书情报领域大数据研究的主要力量,他们具有浓厚的大数据研究底蕴,拥有较强的科研实力和科研队伍,是国内该领域大数据研究的主力军。但是,该领域公共图书馆的相关研究人员较少,因此,还需要更多的专业人员加入公共图书馆,给予更好的理论分析及实践研究。
3.4关键词知识图谱
关键词是文章研究内容的直接体现,对关键词出现的频次进行统计,可以确定图书情报领域大数据研究的热点和发展动向。在2008―2015年,节点选择关键词,运行CiteSpaceIV,生成图书情报领域大数据研究关键词知识图谱,其中,共有58个节点,80条连线,网络整体密度为0.0484。总体上看,关键词知识图谱节点联系较为紧密,图书情报领域大数据研究主题较为集中,图书馆和高校图书馆是当前图书情报领域大数据研究的主要机构,并且相关研究人员也多集中在图书馆或从事图书馆学研究。
同时,经清理,整合关键词,利用IBMSPSS统计出包括“大数据、图书馆”在内的高频关键词(由于篇幅有限,统计结果未列出)。大数据时代下,国内图书情报领域围绕大数据研究产生了一系列的关键词,包括图书馆、高校图书馆、信息服务、数字图书馆、数据挖掘、云计算、数据分析、竞争情报、数字资源、情报分析、数据处理等。大数据推动着图情机构服务模式的改变,要求服务创新,提供个性化、信息化的知识服务、数据服务、学科服务。大数据环境下,作为信息中心的图书情报机构,在数据分析、情报分析、数据处理、资源建设、数据存储、决策支持等方面面临巨大考验。
结合图4和关键词统计结果可以总结出我国图书情报领域大数据研究的几个方面:①图书情报领域大数据研究面临的机遇和挑战。海量数据将对图书馆的存贮能力提出挑战,对信息服务、数据挖掘、数据处理、数据分析提出了更高要求。吴金红等人认为:全面、社会化、真实、准确、及时有效的数据给竞争情报带来机遇,但情报存储、情报安全、情报分析、人才紧缺等问题也是竞争情报不得不面对的挑战。②大数据时代图书情报的创新服务与发展。大数据时代图书馆的服务可能更具有针对性和鲜明性,其服务方式、途径、模式等都将发生改变。李广建等人认为:大数据时代下情报研究的发展趋势可以总结为5个方面:多种数据源综合利用、全方位的情报研究、新型信息资源的分析、情报研究的严谨性和智能化。③大数据时代图书情报的资源建设。图书情报机构一直将资源建设作为工作重点,资源建设也是其开展个性化服务的基础和保障,大数据时代下资源利用和开发程度得到空前深化,同时意味着资源组织和建设工作力度也必将加大。大数据时代下,重视用户需求资源显得十分重要,而云计算、物联网等技术正是为用户资源需求的决策处理与应用提供了技术支持。
4结语
笔者对近8年国内图书情报领域大数据研究论文进行统计,采用文献计量方法,利用知识图谱工具,以可视化的效果展示并分析了当前国内图书情报领域大数据研究的现状。总体来看,得出以下结论:①从国内图书情报领域大数据研究的时间及期刊分布来看,该领域大数据研究已经积累了大量文献,未来几年该领域研究热度不减,国内图情领域对大数据将进行更深入、更广泛的研究。同时,该领域研究的核心期刊群已经开始形成,但缺乏交叉学科的研究,因此,应该多吸收其他学科的专家加入。如:计算机学科、经济学、管理学等专家,更深入地进行图书情报领域大数据研究,获取更好更多的研究成果。②从国内图书情报领域大数据研究核心作者来看,高校图书馆员和专业教师仍是我国图书情报领域大数据研究的主要力量,但该领域公共图书馆的相关研究人员较少。因此,还需要更多的专业人员加入公共图书馆,给予更好的理论分析及实践研究。相关研究人员在大数据研究的创新性和持续性方面有待加强,应将情报机构及信息服务工作的实践应对策略研究作为研究重点。③从国内图书情报领域大数据研究关键词来看,其研究内容主要总结为3个方面:图书情报领域大数据研究面临的机遇和挑战、大数据时代图书情报的创新服务与发展、大数据时代图书情报的资源建设。但是,总体来说,该领域研究侧重于理论探讨,在技术和实践应用上还有待加强。
参考文献:
[1]肖明,孔成果.大数据:何去何从:基于文献计量学的视角[J].图书馆学刊,2014(11):110-117.
[2]樊一阳,许京京.基于CiteSpace文献计量法的石墨烯研究文献可视化图谱分析[J].现代情报,2015(8):81-91.
[3]Chen C.CiteSpaceⅡ:Detecting and visualizingemerging trends and transient patterns in scientific literature[J].Journal of the American Society for information Science and Technology,2006(3):359-377.
[4]许智.图书情报学知识服务的知识图谱分析[J].现代情报,2013(2):166-170.
[5]夏丽华,谢金玲,等.SPSS数据统计与分析标准教程[M].北京:清华大学出版社,2014:191.
[6]余少瑛.我国图书馆知识产权研究的文献计量统计分析[J].情报科学,2012(2):183-189.
[7]邱均平.信息计量学[M].武汉:武汉大学出版社,2007:105.
[8]宁宝英,宋敏红,申巧南,等.1982―2011年[高原气象]趋势:基于文献计量分析结果[J].高原气象,2012(1):285-293.
[9]陈悦,陈超美,胡志刚,等.引文空间分析原理与应用:CiteSpace实用指南[M].北京:科学出版社,2014:69.
[10]王春华,李维,文庭孝.我国图书情报领域大数据研究热点分析[J].图书情报知识,2015(4):82-89.
[11]吴金红,张飞,鞠秀芳.大数据:企业竞争情报的机遇、挑战及对策研究[J].情报杂志,2013(1):5-9.
[12]李广建,杨林.大数据视角下的情报研究与情报研究技术[J].图书与情报,2012(6):1-8.
版权声明:本文为一世相伴论文网(www.14380.com)发表,未经许可,不得转载。
- 上一篇:物联网技术论文范文(精选3篇)
- 下一篇:中日文化差异论文范文(精选3篇)