1 科研数据管理概述
1.1 科研数据管理相关概念
美国国家自然基金认为[1]:“科研数据,是指通过观察、计算或实验等手段产生的任何以数字形式存储的信息,包括文本、音视频、算法、模型等。”CNAS,即中国合格评定国家认可委员会将科研数据定义为:“在科技活动(实验、观测、探测、调查等)或通过其他方式所获取的反映客观世界的本质、特征、变化规律等的原始性、基础性数据,以及根据不同科技活动需要,进行系统加工整理的数据产品和相关信息[2]。”可见,科研数据是具有广泛意义的,是学术研究的基础,可以为科学研究提供原始资料。
1.2科研数据管理发展历程
上个世纪50年代一些发达国家成立了世界数据中心和国际科学技术数据委员会,开始关注科研数据的管理问题。《新媒体联盟地平线报告:2017图书馆版》一书中认为科学数据管理是图书馆发展的一个重要趋势[3]。2017年美国网络信息联盟发布的年度议题中将科研数据管理描述为一个“影响未来学术记录变化的巨大持续性问题”。
近些年我国相关部门颁发了《中华人民共和国科学数据共享条例》等数据管理规章制度。2019年1月1日由CNAS组织编制的《科研数据特征划分及其分类体系表》发布,提出科研数据混合分类法的编码方法 [4]。2019年6月11日中共中央办公厅、国务院办公厅印发了《关于进一步弘扬科学家精神加强作风和学风建设的意见》,“要求论文等科研成果发表后1个月内,要将所涉及的实验记录、实验数据等原始数据资料交所在单位统一管理、留存备查。[5]”
科研数据管理是高校图书馆面临的新的挑战,正如2018年3月17日由国务院颁布的《科学数据管理办法》中所说的,高等院校是科研数据的一个主体,面对如何将科研人员在研究过程中产生的大量实验记录、实验数据、论文等成果更有效的组织、保存和利用等问题,图书馆在数据管理方面有深厚的理论基础和实践经验,因此应充分发挥其在数据管理中的作用,更好的为科研人员服务。在国内外一些高校图书馆已经开展了科研数据管理服务,如国外的多伦多大学、南洋理工大学、加州大学伯克利分校、国内的北京大学、武汉大学图书馆等。
2 国内外高校图书馆科研数据管理的实践
2.1 国外高校图书馆科研数据管理的实践
在美国,美国研究图书馆协会、数字图书馆联盟和Duraspace共同成立了数字科学研究院,为学术研究型图书馆用户提供数字化研究以及科研数据保存管理的机构层面的支持,同时加入该研究院的还有埃默里大学、伊利诺伊大学和密歇根大学。在加拿大,多伦多大学、英属哥伦比亚大学、麦吉尔大学、阿尔伯塔大学等多所大学图书馆在 “数据管理计划、组织、数据的备份与存储、获取与共享、出版、引用、培训教育”等方面开展了科研数据管理服务[6]。新加坡南洋理工大学图书馆2014年学术交流部成立了数据管理团队,2016年4月,南洋理工大学通过了科研数据政策,要求所有获得资助的科研项目的负责人都必须在科研信息管理系统中创建并提交数据管理计划 [7]。新西兰有8所公立大学图书馆开展了科研数据管理服务,RDM服务的主要内容有DMP、数据描述、数据获取、数据发表、数据存储等十个方面[8]。国外的高校图书馆科研数据管理着重于数据管理计划、数据存储、数据利用和培训教育等方面。
2.2 国内高校图书馆科研数据管理实践
在国内,北京大学图书馆以哈佛大学开源系统Dataverse为基础构建了北京大学开放数据服务平台,在数据管理、数据素养、长期保存、数据政策等方面提供服务[9],对北京大学科研人员在科研过程中产生的数据给予管理,提供数据整理、分类和归档服务,与服务对象签署保密协议,坚持遵守数据保存和安全的有关政策[10]。复旦大学社会科学数据研究中心也与哈佛大学合作开发了开放科研数据平台,并结合复旦大学图书馆现有的资源和设备,聘请了专业的管理员提供数据服务、定量研究方法教学和跨学科研究[11]。“武汉大学科研数据管理”将开源软件Dspace作为平台,由武汉大学图书馆、武汉大学信息管理学院等四家单位共同建设了高校科学数据管理平台,进行数据的长期保存及对外发布,实现数据共享,建立数据提交、数据组织、数据保存、数据共享、数据使用等规范[12]。
3 我国高校图书馆科研数据管理的启示
3.1 宏观层面
3.1.1 协调中心
英国白玫瑰大学联盟一项调查显示:“大部分北美、澳大利亚、欧洲机构的科研数据管理政策源自学校图书馆, 而制定政策的过程却涉及信息技术部门、科研负责人、法务人员等多个利益相关方[13]”,可见科研数据管理需要多个部门的合作,高校图书馆需要发挥桥梁作用,将各方联系起来,对科研数据管理相关政策正确解读传达给科研机构,将科研机构的需求反映给其他部门。同时设置科研数据的权限(管理权限和访问权限等),将科研机构产生的科研数据分配唯一标识符、按照统一的标准组织起来、提高科研数据的利用率。
3.1.2存储中心
图书馆主要依托机构知识库将科研数据备份、短期存储、长期保存,为科研人员提供标准的数据引用格式、永久访问地址,从而提供科研数据的存储服务。机构知识库可以实现异构资源的互联及机构内各个成员资源的汇集、梳理、分享,通常包括公开成果库和内部资料库,内部资料库存储了实验数据、过程文件等非公开发表文献[14],目前许多高校图书馆建成了本校的机构知识库,存储容量已经达到TB级,可以利用机构知识库建设经验、技术和资源、存储能力来存储科研数据,实现科研数据存储与机构支持库的链接。
3.1.3 整合中心
由于各科研机构产生的数据是分散的、格式不统一的,而在可以公开的数据中又存在着相互交叉、相互引用的关系,针对这一问题图书馆在对科研数据管理过程中可以将科研数据格式化,通过建立数据的关联,融合语义网等技术,对科研数据进行整合,促进跨学科数据资源的可相互利用。
3.1.4共享中心
科研数据的共享有利于提高数据资源的利用度,提升科研数据的价值。图书馆可以借助科研数据资源共享平台成为科研资源的共享中心,将数据资源按照规范标准组织起来通过共享平台向科研人员发布、检索、利用和下载服务,向科研人员解读引导共享政策。目前较为成熟的共享平台是英国Figshare科研数据共享平台,Dataverse平台,我国已有高校图书馆建立了多学科平台,如北京大学的开放研究数据平台。
3.1.5培训中心
图书馆成为科研数据管理的培训中心,主要通过讲座、研讨会、MOOC、在线课程等方式提高读者的数据素养,提高他们获取数据、管理数据及利用数据的能力,使读者可以熟练使用科研数据管理平台和工具,正确选择元数据框架,从而提高科研数据管理的能力。除了对科研人员的培训外,馆员自身服务水平也需要不断加强,因此对馆员的培训也是不可缺少的。
3.2 微观层面
图书馆微观层面的科研数据管理服务是依据科研数据生命周期开展的,根据多年的发展经验国内外机构总结了多种科研数据生命周期模型,目前常使用的生命周期模型有适用于数字对象和数据库的DCC审编生命周期模型、适用于数字资源库的 OAIS 功能模型、适用于社会科学的 DDI组合数据生命周期模型和ICPSR数据生命周期模型、适用于社会经济研究数据的UKDA数据生命周期模型、适用于“大数据”学科的DataONE 数据生命周期模型等 [15],有的模型是面向研究数据的、面向科研过程的,有的是链状的、有的是环状的,图书馆可根据学校自身特点选择适合本校的科研数据模型,也可以研究自身的科研数据生命周期模型,下面就图书馆在科研数据生命周期管理中的着力点逐一加以介绍。
3.2.1 数据收集
图书馆作为本机构科研数据的存储中心,需要将实验数据、记录按照某些规则收集起来,这些规则包括签订版权协议、共享协议、数据加工协议等,如对可以公布的数据签订数据共享协议等,而某些敏感、涉密等不允许公开的数据需要签订保密协议等。图书馆除收集本机构的科研数据外,还需收集其他科研机构、网络中等各种途径可以获取的有利于本机构科研机构研究的数据,为科研人员研究时使用。
3.2.2 数据组织和加工
图书馆在数据组织方面具有丰富理论与实践经验,对元数据标准方面的研究深入,应充分发挥其在这方面的优势。图书馆将收集来的科研数据通过分析其主题等特征用都柏林核心元数据等标准规范对其内容、结构和内部关系进行描述,深度揭示数据背后的关系,形成有序的、规则的、格式统一的数据,这样科研数据才能得以更好的存储、共享和利用,提高科研效率。
3.2.3数据分析
数据分析是图书馆提供深层次服务的一个方面,图书馆可利用分析工具如Stata、SPSS等专业分析软件对科学数据进行统计分析、聚类分析、可视化分析等服务,如以折线图、柱状图、K线图、地图等形式为科研人员提供可观察的、可理解的、方便使用的数据分析结果,向科研人员提供总结性信息和预测性信息等。图书馆可购买现有的数据分析平台,如Hadoop、Datahoo等软件,还可以自行开发,国外有的图书馆就自行开发了数据统计分析软件,如普林斯顿大学图书馆等。
结语
我国高校图书馆科研数据管理研究越来越得到业界学者的关注,从最初的借鉴欧美、亚洲等发达国家的经验到现在的我国高校图书馆科研数据管理的成功实践,从《科学数据管理办法》的颁布到《科研数据特征划分及其分类体系表》的发布,这都标志着我国科研数据管理在理论和实践及政策建设方面的发展与进步,然而在科研数据相关政策、标准规范和管理平台建设等方面的研究还需要进一步加强,而这需要政府、科研机构及图书馆等信息机构的协同工作。政府在制定科研数据管理相关政策发挥统领作用,从政策层面保证工作的顺利进行,同时科研机构和信息机构需要积极响应政策,图书馆等信息机构提供相应的技术支持、做好科研机构的管理服务工作,这样经过多方合作共同推进我国科研数据管理事业的发展。
参考文献
[1] 刘桂锋,李杰.国外科研数据管理研究进展——基于CiteSpace和VOSviewer的可视化分析[J].图书情报研究,2016(4):9-22.
[2] CNAS技术报告科研数据特征划分及其分类体系表[EB/OL].[2019-06-30].http://www.doc88.com/p-7042533423212.html
[3] S.Adams Becker … [等]著,赵艳 … [等]译.新媒体联盟地平线报告:2017 图书馆版[J],图书情报工作,2018,62(3):114-152.
[4] https://max.book118.com/html/2019/0426/8010105116002020.shtm.
[5] https://www.sohu.com/a/321010931_698856.
[6]韩金凤.加拿大高校图书馆科研数据管理服务调研及启示[J].国家图书馆学刊,2017(7):38-45.
[7]王丹丹.新加坡南洋理工大学科研数据 管理服务的实施与思考[J].大学图书馆学报,2019(2):67-74.
[8]刘莉,雷盯函.新西兰公立大学图书馆科研数据管理调查与研究[J].图书馆工作与研究.2018(3):58-63.
[9] 崔海媛 …[等].研究数据管理服务框架研究与构建:以北京大学为例[J].图书情报工作.2019,63( 1) :81-90.
[10] https://www.lib.pku.edu.cn/portal/cn/fw/sjfw/keyanshuju.
[11] https://dvn.fudan.edu.cn/home/index.jsp.
[12] http://sdm.lib.whu.edu.cn/jspui/.
[13]新媒体联盟地平线报告:2017图书馆版. 图书情报工作,2018,62(03),114-152.
[14]https://baike.baidu.com/item/%E6%9C%BA%E6%9E%84%E7%9F%A5%E8%AF%86%E5%BA%93/1120035?fr=aladdin.
[15] 杨 林,钱 庆,吴思竹.科学数据管理生命周期模型比较[J].中华医学图书情报杂志,2016,25(11):1-6.
作者简介:1.王威(1984年5月-),女,汉族,山东招远人,硕士,哈尔滨职业技术学院科研处《哈尔滨职业技术学院学报》编辑部,编辑,研究方向为科研管理、编辑理论与实务、职业教育。
2.庞海燕(1982年12月-),女,汉族,黑龙江青冈人,硕士,哈尔滨工业大学,图书馆,馆员,研究方向为知识管理、科技查新.