上一个
下一个

长期保存重要性

7 三月 2020 | by admin | 分类目录 : 技术专题

1. 数字科技文献资源发展与利用的趋势

随着数字化网络化的普及,数字文献资源已经成为科技领域的主流信息资源,学术期刊和会议录已经形成以数字出版为主的形态,学术专著也迅速走向数字出版,同时多数开放出版期刊以数字版为其唯一正式出版形态。业界预测,最迟不超过2020年,科技学术期刊将以数字出版为其唯一形态(e-only)。

由于科技学术资源的迅速数字化趋势,数字科技文献已经成为科技用户使用的主流资源。在我国科研教育机构,数字文献的使用远远超过印本文献。主要科研教育单位均已将数字文献作为自己的主流科技文献资源,并不断削减纸本文献订购。国外研究图书馆开始建设e-only的科技文献资源体系,例如耶鲁大学科技和医学类图书馆将在2010年基本实现e-only,斯坦福大学工程图书馆也将在2009年停止订购纸本文献。国内许多单位也已开始建设e-first的科技文献资源体系,例如中科院国家科学图书馆。

2. 数字科技文献资源长期保存的严峻挑战

数字科技文献的普及极大提高了用户获得文献的能力,但也带来了可靠使用和永续利用方面的严峻挑战。

数字资源可靠使用和长期保存面临严重的技术危机。数字介质的不稳定性难以保证可靠的长期保存;数字信息的使用依赖严格的技术、经济、安全等条件,而这些条件容易受到其他因素的影响,造成数字信息的不可用;信息技术的变化致使利用数字信息的技术和软硬件迅速过时,造成新的技术环境下不能利用以前的数字信息;数字信息的动态变化造成无法准确确定和验证原来的信息单元,造成信息单元的起源及其归属变化难以追踪,以致信息单元难以辨识和利用。数字信息的庞大生产量使上述问题更加突出。

数字资源可靠使用和长期保存面临严重的使用机制危机。数字文献的采购、使用和典藏机制不同于纸本文献的相应机制。目前情况下,国内外图书馆基本采取了购买科技文献资源一定时间内的网络使用权,由出版商或其代理直接提供(或通过所控制的镜像系统提供)数据库的网络服务,用户通过远程访问检索获取相应资源。由于图书馆只拥有采购合同期间的网络使用权,一旦终止采购合同,图书馆对于曾经采购的资源的使用权就难以保证。即使数据库商允诺所谓“永久使用权”,也往往需要额外支付使用费、或者只能使用“简版”“旧版”系统,往往限制了图书馆用户对这些资源的使用。即使在合同执行期间,由于自然灾害、人为破坏、战争、法律纠纷、系统灾难性故障、财务危机、商业决策、政府行为、国际争端等原因,造成数据库商终止经营或者不继续提供服务,或者造成数据本身的永久性破坏,使得图书馆的网络使用权被强制剥夺,失去对自己购买的资源的可持续使用权。数字资源的使用机制打破了传统的信息保存责任体系,部分剥夺了传统信息保存机构的保存权利。

数字资源可靠使用和长期保存面临严重的保存机制复杂性。数字文献资源长期保存涉及诸多因素,致使其面临复杂挑战。数字资源存在复杂的知识产权关系,涉及资源创造者、出版商、保存者、授权用户、公共投资者等利益主体,需要对资源存档、数据整理和数据服务等权利进行详细约定,协调关系,保护权益。数字资源多采取集团采购、因而存在复杂的投入与服务关系,集团采购不能简单平滑转移为共享保存,在数字资源的资产归属权、谁拥有保存权、保存负担该由谁承担、保存者应该向谁提供服务等问题上都存在模糊之处,将涉及职责划分、利益分配、以及过程与效果的监督等问题,需要有合适的机制来明晰责任、清理关系、协调利益、调动各方积极性。数字资源长期保存涉及长期的高成本投入,包括设施设备、技术、人员、管理机制等,而且由于长期保存需要复杂的技术系统、技术本身又在不断更新、需要持续的高水平的系统更新与技术保障,因此单个机构难以负担保存成本;但由于数字资源的可广泛使用和严格权限控制,又使得传统分散保存机制既不经济又不可行。数字资源长期保存往往依赖稳定可靠长期的机构保障,但由于政策变更、机构变迁、法律限定、经费增减、人员调整、或简单的管理失误等,容易造成保存机构未能或不能履行保存责任,需要建立相应的政策、体制、过程,从法律上、经济上、组织上对保存效果进行公开认证与检验,保证在保存机构不能履行保存责任时有效防止保存失败和实现保存接替。

3. 国际数字科技文献长期保存的现状与趋势

国际上对数字资源长期保存已经高度重视,经过多年研究和实践,已经初步形成比较可靠的数字资源长期保存机制。

国际上数字资源长期保存大体经历了三个阶段。

(1) 初始论证分析阶段(-1995年),开始分析长期保存的必要性、可能存在的技术与制度问题等,澳大利亚国家图书馆、美国研究图书馆集团等先后对数字资源长期保存进行了系统的调查。

(2) 试验探索阶段(1996-2000年),比较系统地探索长期保存的问题框架、组织策略、权利与法律、技术系统、元数据等。美国RLG提出了具有里程碑式的研究报告《数字归档特别工作组报告》,美国CCDSD提出了著名的OAIS参考模型,澳大利亚和Internet Archive分别开始了网络信息资源保存项目的实施,英国JISC资助了包括CEDARS等在内的多个长期保存项目,荷兰国家图书馆实现并推出了电子期刊保存系统e-Depot。

(3) 应用部署阶段(2000年-),各主要国家开始建立国家或区域战略合作保存体系,开始了数字资源长期保存活动的规模化应用部署。美国国会图书馆提出了NDIIPP项目,英国JISC通过了“JISC数字资源持续保存策略”,大英国家图书馆开始了网络归档的Domain.UK项目,美国各个主要大学开始建立本校的数字仓储系统,包括Portico和LOCKSS在内的许多大型长期保存系统开始正式运行,针对长期保存的GDFR 和PRONOM等公共服务系统也应运而生。

国际范围的数字资源长期保存实践取得了丰富的成果,为我国开展数字资源长期保存系统建设提供了良好的基础。已经形成了较完善的长期保存问题架构,对长期保存的问题、任务、技术挑战、法律挑战、支持结构和最佳实践要求进行了系统分析,提出了分布式保存责任体系、失效保护(Fail-safe机制)和保存继承规划(Succession planning)等重大保障措施,OAIS模型所提出的由保存规划、摄取、数据管理、数据存储、存储管理、存取管理等模块组成的保存系统,由存缴信息包(SIP)、存储信息包(AIP)和传播信息包(DIP)等形成的保存信息流,以及相应的信息结构,都已经成为普遍采用的标准。逐步完善了长期保存的技术与过程标准规范,包括长期保存元数据CEDARS、NEDLIB和PREMIS等,数字对象封装标准DIDL、METS和fedora对象结构,OAI开放存取协议、OAI-ORE对象复用与交换协议和SRB标准资源中间件,Fedora/DSpace/ePrint等开源数字仓储系统,DOI/Handle和URI/PURL等数字对象唯一标识符机制,以及通过荷兰DIAS的规模化实践所提出的数据刷新、数据迁移和软件仿真等长期保存技术机制。进一步充实了长期保存的法律机制,澳大利亚、英国、挪威、瑞典、荷兰和阿根廷分别制定了数字资源的呈缴规定,《数字归档特别工作组报告》、《可信赖存储系统:属性与责任》、美国NDIIP项目研究报告、UNESCO《数字遗产保存指南》等分别就保存活动中的参与者及其权利、义务和责任做出了相应的分析,相关研究组织还提出了可信赖保存系统的认证机制。涌现了一批大规模和实践化的长期保存应用系统,包括可构建长期保存系统的开源软件(例如Fedora、Dspace和ePrint),一批全文期刊长期保存系统已经投入运行(例如Protico、LOCKSS以及CLOCKSS、e-Depot、aDORe等),另外,Internet Archive公开搜寻保存网络信息和接受第三方捐赠保存数字资源,澳大利亚国家图书馆致力于保存澳大利亚网络资源的PANDORA系统,英国的网络存档联盟,英国国家档案局的英国政府网站资源保存系统,以及瑞士国家图书馆的瑞士网络存档系统等。

在上述成果的基础上,国际数字资源长期保存研究与实践正向建设长期、可靠和合作的保存机制发展。

数字资源长期保存呈现大规模合作的趋势,已经由单独的图书馆扩展到图书馆联盟,从以图书馆为主扩展到数字对象生命周期中所有的参与者(研究机构、保存机构、出版界、信息技术商等),例如美国NDIIPP要求在政府、国会图书馆、其他图书馆、信息生产商、信息服务商和其他第三方服务商之间进行合作,欧洲NEDLIB项目则由欧洲8个国家图书馆、两个信息技术组织和三个主要出版商共同参与,美国Protico也是由信息生产商、信息服务机构和图书馆来共同运作。

数字资源长期保存内容呈现日益丰富化的趋势,保存内容正在从原来单纯科技文献和网络信息资源拓展到科学数据、社会科学数据、音像资源、文化资源和机构知识资产等方面,例如欧盟的CASPAR项目就已经开始将文化、艺术和科学方面的知识作为保存、利用和检索的对象。再比如英国科技设备委员会下属CCLRC 的Data Curation项目正在研究科学数据的长期保存保存。

由可靠经济模式支持的大规模实用系统开始“唱”主角,长期保存已经基本上走过了小规模分散试验阶段,大规模使用的实用系统已经开始为各类机构提供可靠的长期保存解决方案,类似前面提到的Protico、EJC、LOCKSS/CLOCKSS和e-Depot等。它们不仅提供技术系统,而且从规划、管理、经济、服务等角度提供全面解决途径,力争成为资源权属单位的可信赖保存服务商。

建立可靠的长期保存运行机制开始成为重点关注对象,数字资源长期保存的可信赖要求,可靠的规划与管理工作流程,可信赖保存系统的认证与评价,长期保存服务协议管理,长期保存合作体系管理,长期保存服务的经济模式等,都已经成为长期保存国际会议和重要研究计划的关注要点,也成为重大合作保存计划的核心内容之一。

长期保存正从微观系统建设转向国家宏观战略规划。荷兰国家图书馆已经将原来实验性的数字学术资源保存系统e-Depot正式纳入其预算和组织结构之中,成为国家图书馆的资源与服务战略的组成部分。美国NDIIPP项目在国会支持下试图全面规划和促进国家范围数字资源长期保存体系的建设,英国JISC2002-2005进行的“JISC数字资源持续保存策略”项目以及2004-2006进行的“支持机构的数字保存和财产管理计划”也是力图在全国范围协同开展数字资源长期保存。

 

--改编自《我国数字科技资源长期保存示范体系建设立项工作建议》,张晓林、吴振新等,2007年11月