资源保存范文

2024-09-07

资源保存范文(精选11篇)

资源保存 第1篇

关键词:网络信息资源,保存

网络信息资源日益成为我们文化遗产的重要组成部分。网络信息资源是指通过计算机网络发布、传递和存储的各种信息资源的总和。数字信息技术的发展、网络信息资源的急剧膨胀在体现其优越性的同时也为我们带来了一个不容忽视的问题———网络信息资源的保存问题, 由于网络信息的动态性特点, 其消失的速度也很惊人, 与其他物理形态载体的信息相比, 网络信息的生命更脆弱, 更容易破坏, 可以说, 我们正在失去网络上有价值的学术和文化资源。因此, 保存网络信息资源已成为网络环境下全人类所面临的一个重大课题。

一、网络信息资源保存的基本要求

网络信息是数字信息的一种, 它同数字信息一样只有依赖众多的技术、方法工具和管理机制才能被人们所利用, 因而网络信息资源的保存实际上需要保存网络信息本身及相关的技术、方法和工具。为此, 数字信息长期保存必须满足以下要求:

1. 保存数字信息比特流。

通过对数字存储介质的保护或迁移, 确保存储其中的物理数字数据能被准确完好地读出。

2. 保存数字信息的功能性。

数字信息具有远远超出传统信息的功能性, 它可以包含多媒体成分;可以以超文本存在;还可以含有由数字存储器自动产生的动态成分。另外, 数字信息还具有导航功能, 如工具栏、关键词或内容交互式表格等。这些截然不同于传统信息的功能性, 要求能完整地保存下来。

3. 保存数字信息的出处。

数字信息的出处, 能证实该信息的来源与历史, 有助于确认该信息是真实、完整和可信的。所以, 保存数字信息的出处, 对于真实、完整地保存数字信息是十分必要的。

4. 保存数字格式与处理信息。

通过保存有关数字信息编码、格式、标记、结构、压缩、加密等方面的技术方法信息, 确保能够识别和解析数字信息内容。

5. 保存数字信息的管理手段。

包括数字信息的内容校验、身份认证、版本演变、知识产权管理机制、信息安全机制等。这样做的目的是为了确保能可信、可靠和合法鉴别、使用被保存的数字信息。

二、网络信息资源保存的步骤

1. 网络信息资源采集。

所谓网络信息资源采集, 就是及时选择Web上值得保存的信息资源, 并通过各种方法进行收集与归档, 以备当代和后代人利用。它主要包括三个方面:一是确定采集范围;二是选择采集方式;三是确定采集频率。采集范围的确定主要包括确定采集级别、划定归档Web空间与选择采集对象等方面。采集级别是网络信息资源采集与保存的总指导原则;归档Web空间的划定是从大的范围来说, 即哪些网站可以作为采集对象, Web空间的划定必须有一个明确的规则, 否则就会造成采集对象的混乱。 (1) 确定采集级别。采集级别是网络信息资源采集和保存的总的方向, 确定不同的采集级别对于明晰归档网络信息资源的管理与保存责任具有极大的影响。从目前来看, 采集级别的划分主要包括以下五个方面: (1) 归档级 (Archived) :图书馆采集数字资源, 并将永久保存和提供利用。 (2) 服务级 (Served) :图书馆采集数字资源, 但不会像“归档级”那样保证其长期存取。 (3) 镜像级 (Mirrored) :图书馆只将资源复制一份在服务器上, 但并不归档保存, 也不负责资源的内容与维护。 (4) 链接级 (Linked) :不采集归档, 只是进行资源链接, 图书馆对资源不具有控制权。 (5) 检索工具级 (Finding aids) :图书馆建立检索工具和元数据, 以便发现和检索数字资源。元数据与数字资源紧密联系, 但与资源分开存储和管理。 (2) 划定归档Web空间。通常做法是各国采集与本国有关的重要信息。归档Web空间的划定应遵循以下标准: (1) 国家域名为顶级域名的网站。 (2) 服务器的物理地址在本国的网站。 (3) 由本国组织、公民拥有或内容由本国人创作的网站。 (4) 使用本国官方语言 (母语) 的网站。这四个标准各有利弊, 若单独使用未免有失偏颇。所以最好将其结合起来, 以其中的某一个标准为主, 其他为辅。鉴于我国国情与历史文化特点, 笔者建议, 以汉语语言作为划分中文Web空间的主要标准, 其他为辅助标准, 并结合使用。 (3) 确定采集频率。由于需要采集的网络文献数据量非常巨大, 每一次完整捕获要持续数月。一般认为自动获取每6个月采集一次是比较合适的, 这个时间间隔对于一些稳定、不会随时更新的网站来说是可行的, 但是有许多网页的寿命极为短暂, 在这段时间内可能有许多网页发生变更或被删除。还有一些新闻网站, 显然按6个月的频率是不可行的。所以最好的解决措施是对不同的网站类型分别计算其更新频率, 以保证采集频率与之同步。

2. 选择存储载体。

无论信息处理技术多么的先进, 我们都必须将信息存储于一定的载体之上, 信息和信息技术本身都需要依托于一定的存储载体而存在。载体的好坏是影响数字信息长期保存的一大因素。一般地, 对于普通的个人用户, 使用硬盘和光盘等存储数据就已经够用了, 但对于图书馆、档案馆以及信息中心保存网络信息资源来说, 磁带机、磁带库和光盘库则是必不可少的信息存储与备份设备。

3. 提供查询与访问。

这里的访问 (access) , 即向用户提供服务。网络信息资源保存的根本目的是提供服务, 那么海量的归档Web信息通过何种接口提供检索和服务就是一个需要解决的问题。总的来说, 归档Web信息的服务分为三种方式, 即主题型、URL型、全文检索型。 (1) 主题目录型。日本WARP项目和澳大利亚Pandora项目均采用选择性采集的方针, 这些归档网络信息资源都是人工进行主题分类, 提供读者浏览。这种方法的最大缺点就是如果读者不熟悉主题知识就无法找到所需信息。 (2) URL型。美国Internet档案馆和北京大学Web信息博物馆采用的服务方式。当读者指定所要查找信息的URL后就会检索到一个时间列表, 可以浏览历史网页信息。但是如果读者无法知道要找网页的URL, 就无法检索目标网页。这种方式的致命缺点就是不能通过关键词和主题词检索存档的信息。 (3) 全文检索型。归档网络信息资源的全文检索与普通的全文检索不同, 不仅仅要实现对“空间”的检索, 还要实现对“时间”的检索。北欧Nordic Web Archive已经开发了系统内专用的浏览器, 可以实现历史网络信息的穿梭, 已经实现了归档信息的全文检索。

4. 组织与管理。

网络信息资源保存中的组织与管理目前主要是责任体系的划分与合作机制的创建问题。 (1) 划分责任体系。从采集责任上说, 目前, 缺乏专门的机构对整个网络信息资源的保存负责, 也没有统一的政府级别的组织来制定采集标准或网站保存策略。因此, 政府应制定法令, 要求网络信息资源的产生者、拥有者与提供者都应该对网络信息资源保存负责。以防止有价值的数字资源流失。另外, 从长远来看, 网络信息资源保存是一种文化行为, 是一种社会公共事业。依靠商业公司的短期保存行为, 网络信息资源显然不会像过去那样长久稳定地存在下去。数字信息的转瞬即逝与易于损坏, 加之硬件、软件使用寿命较短, 使得国家比以往任何时候都更需要加强专业保存机构的保存功能, 而不是削弱这一功能。在当前环境下, 在国家层面上建立全国的网络信息资源保存体系是必需的。网络信息资源的保存是高度专业化与组织化的专项工作, 国家必须以法律为依据, 从系统的角度确定整个Web图书馆的发展方向, 并从组织上保证法规的贯彻执行。 (2) 建立合作机制。网络信息资源保存是一个规模庞大的、复杂的、社会化的系统工程。单凭政府投入所需资金和技术力量, 是难以完成这一艰巨任务的, 只有多方合作才能达到数字资源的长期保存与共享。因此网络信息资源保存行动应积极主动地与信息技术界、企业界、出版界等建立友好合作关系, 同文化教育、公共传播、公共管理等许多领域的人士广泛合作, 吸收外界资金、技术和人力, 尤其是版权、标准、通信容量与速度、数据库开发建设等方面特别依赖于社会各界的通力合作。作为保存人类文化遗产的责任部门, 图书馆、档案馆应当搭建多行业、多方面的合作平台, 构建合作与协调的网络信息资源保存与管理新模式。

对数字资源长期保存策略的思考 第2篇

摘 要:数字资源的长期保存是数字图书馆建设中的一个重要环节。随着数字化、多媒体化和网络化等信息资源的日益增长,如何构建合理的数字资源保存体系,确保各种数字资源能随时提取利用,则显得越来越重要。本文分析了数字资源长期保存的重要性,并针对性地提出了长期保存的策略。

中图分类号:G250文献标识码:A 文章编号:1003-1588(2009)05-0110-02

1 数字资源长期保存的重要性

随着数字技术和网络的发展,数字资源以前所未有的速度和数量被源源不断地生产出来。由于这些数字资源以其新颖性、时效性、传输速度快、检索功能齐全,同时还能及时跟踪世界科技发展前沿等优势,因此逐渐成为图书馆馆藏的主体和最受读者青睐的信息资源。当前,各图书馆都非常重视馆藏数字资源的建设,并将它视为文献资源建设的重点,投入大量的人力、物力,引进各种大型数据库和相当数量的电子书刊文献,使图书馆的数字资源不断丰富、日益充实。从本质上讲,长期保存实时的、完整的、动态的数字资源,除满足当代人的信息需求之外,更是满足未来用户研究当前社会发展经验的需求,它起到传承民族与人类文化的作用。当前,数字资源的长期保存既缺乏成熟的保存数字资源的标准和协议,又缺乏行之有效的技术手段,还缺乏可靠的法律依据。随着数字资源的大量出现,如何构建合理的数字资源保存体系,确保各种数字资源能随时提取利用,则显得越来越重要。

2 影响数字资源长期保存的因素

数字资源是指以数字形式存在于数字图书馆的信息资源的集合体,它不仅指计算机系统内部的数据库及各种文档,也包括所有与系统链接的能被用户访问的各种资源。数字信息的存储实体不但种类繁多,而且存储实体通常是随时变化的,所保存的数字信息具有可处理性。在数字信息不断膨胀,计算机软硬件设备日益更新的情况下,数字信息的长期保存显得非常重要。从当前的情况来看,影响数字资源长期存取的因素大致有存储信息的物理实体因素、技术因素、经济因素和社会因素等。

2.1 物理实体因素的影响

数字信息是存储在各种类型的物理实体上的,但数字信息存储实体的寿命是有限的,相对传统的纸质介质,数字信息实体容易变质,易受阳光、灰尘、温度、湿度等的影响。如温度过高,会使保存数字信息的光盘等变形或者老化,湿度过大会使光盘损坏。因此,数字信息对存储环境的要求较高,并且使用寿命较短。

2.2 技术因素的影响

从数字信息对其产生的环境的依赖性可知,要保证数字信息的长期可存取性,就应该将其依赖的软硬件设备长期不变的延续下去。这就要求技术的不断向前发展,从而推动软硬件设备的不断向前进步,使存储的时间能够更加加长。

2.3 经济因素的影响

如何高效、经济的维护数字资源信息是值得认真思考的问题。对数字资源存储的费用至今人不能得出一个统一的令人满意的结果,数字资源长期保存的维护费用是比传统纸质信息高还是低,目前没有一个确定的结果。但是就数字资源的维护费用来看,经济方面的因素对数字资源的长期保存有着很大的关联。

2.4 社会因素的影响

社会分工、合作精神、社会氛围、管理机制、信息政策等因素都会给数字资源的长期保存带来各种各样的影响。

3 数字资源长期保存的策略分析

随着计算机技术、网络技术、海量存储技术、信息压缩技术、多媒体技术等的飞速发展及其相互结合,使电子出版物、联机数据库、网络信息资源等数字信息呈现出持续性爆炸性增长。这对数字资源的长期存储形成严峻的挑战,必须从战略高度出发,结合本单位的特点和经济伏况,有选择地进行存储。

3.1 标准化策略

在数字信息的生产与管理中使用标准,有助于数字信息存取与维护的完整性。信息数字技术是不断更新的,新技术的公共标准是连接着当前技术与刚淘汰的旧技术的,新、旧技术的公共标准是有较长时间跨度的,这为旧标准的数字信息更换到新标准的技术平台提供了可能。标准格式的采用有利于数字信息的格式转换,有利于提高信息转换的捕捉率和精确率。数字信息长期保存的标准涉及多方面的因素,除了文件格式标准外,对数字文献的管理,也应采用相应的标准,如ISO为了加强数字文献管理制定了数字文献归档体系结构与操作的最低要求标准;在存储与存取数字信息等方面,也存在着ISO标准,如互用性标准、数据格式标准、资源标记标准、资源著录标准、数据归档与文献管理标准等。采用这些标准,有利于图书馆间的数据交换,促进图书馆系统互操作并支持国家与国际间的图书馆网络的互操作等。

3.2 选择性策略

图书馆数字资源的种类繁多,就其在一段时间的相对稳定性而言,可分为静态数字资源和动态数字资源。静态数字资源包括:图书馆购置的各类电子出版物,如光盘、磁盘等数字资源,图书馆已建的数字化文献资源,以及整个自动化系统所涉及的数据文件,如自动软件本身、服务器的操作系统软件、硬件设备参数、驱动程序、各种常用软件和一些档案文件(如人事档案文件、财经数据);动态数字资源包括:图书馆购置的网络型数据库、读者借阅数据和在建的书目数据、特色数据库等。各种数字资源在不同类型图书馆的地位与作用存在一定的差异,有的数字资源涉及保密问题;有的数字资源具有自主知识产权;有的数字资源是引进或购置的;有的只具有使用权而缺乏拥有权;有的是印刷型文献的数字化复制;有的不仅有印刷型文献,而且同时拥有网络型和光盘型文献。读者对这些文献持续使用的要求也存在一定差异,有的是本馆的核心资源,读者利用率高,必须长期、安全、完整地保存;有的只是服务级、镜像级、链接级的资源,其保存与备份无须馆员操心。图书馆数字资源的构成是具有一定的等级层次的,就图书馆网站而言,就有图书馆个人主页、部室主页、图书馆分馆主页、总馆主页之分。所以,对图书馆数字资源的保存、备份,必须区别对待,根据数字资源在本馆的地位与作用,有选择地采取不同的方式方法加以保护。

3.3 经济性策略

经济性策略不仅仅是经费的问题,在数字信息的长期存取中必须树立经济观念、时间观念和效率观念。少花钱多办事已成为人们普遍遵循的原则,在技术迅速发展的年代,少花时间和精力,提高工作效率往往比金钱更宝贵。数字信息的长期存储与存取环境是与数字信息的产生环境相一致的,数字信息只有在其产生的环境中加以保存与维护才是最经济、最可行和最可靠的。如果在数字信息产生时,就不便存取,那今后的存取将更困难。

3.4 网络化策略

与延长媒体的寿命和将数字信息转换为模拟信息保存的方式相比,采用网络备份代理是一大进步。在利用电脑来从事信息处理的工作环境中,许多单位都制定了信息备份的制度,要求人们每天在下班前或每星期将更新的数据拷贝到磁盘或相应的设备中进行保存,甚至有人建议将一份最完整的备份保存到银行的保险箱中,以杜绝因火灾、水灾或盗窃发生的安全隐患。这真正落到实处并非易事,但网络为我们提供了这种方便性和可行性。利用网络备份代理服务,可以自动将珍贵的数字文献、档案、文件进行备份并将它们存放在相当保险的远程电脑的大型硬盘中。

3.5 协调性策略

为了达到保护的目的,需要通过多种途径,采用多种方法,通过国际、国内、各种文献信息机构的全面合作和大力配合。目前,世界上有许多国家非常重视数字信息的长期存取研究,成立了跨国的协调和研究性组织。

数字资源的长期保存是一个新的、艰巨的和复杂的课题。总之,数字信息对公共基础设施可靠性要求增加了。战争、水灾、火灾、地震、停电等会给信息系统造成破坏,计算机病毒、黑客攻击、网络隐患系统泄密会产生信息数据丢失;技术更新、系统升级、格式转换、信息迁移会给信息读取、信息失真带来不可靠的因素。因此,如何建立备份制度,建立异地存取措施,防范网络隐患,建立保密措施,保护知识产权,以及在技术引进、系统升级时,应优先考虑系统的兼容性、技术的连续性、格式的标准化、信息迁移的可靠性等相关问题,从而为信息安全提供保障。

参考文献:

[1] 黄丽霞.数字资源长期保存的国家宏观规划与管理相关问题分析[J].图书情报知识,2008,(4).

[2] 陈月婷.开放存取资源长期保存模式探析[J]. 图书情报工作,2008,(5).

[3] 潘晓秋.美国数字资源长期保存主要成果及其启示[J].现代情报,2008,(5).

数字资源保存策略探析 第3篇

一、系统保存

系统保存, 就是将数字信息以其最原始的格式储存, 并且将电脑系统保存起来, 可以只保存电脑硬件或应用软件 (可能含资料库系统或其他相关软件) , 也可以将电脑软硬件都保留下来。虽然这是保存数字资源最简单的方式, 只要保存电脑的系统, 就可以维持数字信息的可用性, 可是, 必须一直将过时或很快被淘汰的电脑系统保存起来, 不但成本高且需大量存放空间, 有点像在建立一座电脑博物馆。一般而言, 这个策略花费成本很大, 不能维持太久, 所以只适用于短时间保存。例如:我们在2002年使用Lotus Notes发出一个电子邮件的信息, 并不需要把整个Lotus Notes环境都保存起来, 然后就是为了2100年时, 我们可以看到这个电子邮件的信息, 这样的做法太耗费成本和时间了, 所以此种策略只适合短期目标或是配合其他策略使用。

二、迁移

保持数字对象的长期可用性是数字保存的重要内容, 迁移是广泛使用的一种数字资源长期保存策略之一。数据迁移是根据软件、硬件的发展将数字资源迁移到不同的软件或硬件环境下, 从而保证数字资源可以在发展的环境中被识别使用和检索, 进行数字信息的长期保存。当数据格式过时或发生其他情况时, 利用迁移工具将原始的数字对象迁移到新的数据格式下, 可保证数据在新平台环境下的可用性。根据迁移条件的不同, 迁移可以分为硬件迁移、软件迁移、版本迁移、格式迁移、载体迁移及访问点迁移[1]。如CAM-ILEON项目使用了按需迁移策略, 即将软件设计的技巧与保存原始字节的原则结合起来, 该方法为执行迁移策略提供了更为实用的方法, 减轻了数字保存的负担。DAITSS项目也开发了提供按需迁移功能的迁移器, 通过修改迁移器配置文件来反映新格式的增加。目前, 迁移技术被美国保护与存取委员会和美国研究图书馆组建的数字信息档案特别工作组认为是解决技术过时问题的良策, 国内许多人也认为数据迁移是数字信息长期保存的较优的选择。迁移主要是保存数据内容和内容关系。然而, 迁移方法存在着一些不足, 每一次迁移都可能丢失一定的结构、版式、链接、交互关系等信息, 就会影响以后的迁移, 从而产生不同程度的失真, 因此数字资源的原始样式需要重点保存, 迁移法或许不是最好的选择。迁移还无法准确地保存和提供可信赖的还原机制, 同时, 迁移时需要相应的迁移工具也会造成相关费用的提高。

三、仿真

仿真技术是保存策略的一种, 不但可以确保资料不会遗失, 且可以使得资料的功能在新电脑上完全呈现。数据仿真就是一个计算机系统对另一个计算机系统部分或全部的模拟, 使模拟的计算机系统与被模拟的计算机系统接收相同的数据, 执行相同的程序, 获得相同的结果。虽然不能以模拟的方式来保存所有的文件, 可是事实上这个方式可以让文件精准的重生。仿真允许文件的最原始的应用软件不一定在最原始的系统中运作。如Windows平台集成一个DOS环境, 从而保证原来在DOS环境下开发的软件可以正常运行在Windows平台上, 而再后来的Win32系统又封装了Win16仿真环境, 实现对Win16应用系统的兼容。就理论上而言, 仿真设备可以包含所有的资料和解释资料及重要的应用软件, 所以只要保存了模拟器就等于保存了完整资料。利用电脑软件来模拟被保存的数字信息, 在电脑产业中常常被使用, 不失为一种好方法, 但是对技术要求较严格, 须对该软、硬件及其运作十分熟悉, 否则只要稍微有些偏差即无法达到保存目的。

四、风干

在数字保存领域中, 风干是指从复杂数字对象格式中提取有价值的内容, 保存简单、低技术含量、机器易于还原和被人理解的数字对象格式的过程。基于风干的策略, 就是在保存数字对象的原始版本之外, 还需要保存一个简单、低技术含量、经过干燥处理的数据版本。这种风干数据在很多中长期保存的数字格式中得到了检验, IETF的RF-Cs (Request for Comments) 的仓储就是一个重要的例子[2]。RF-Cs是一套关于Internet技术和组织说明的仓储, 从1969年开始成为RFC连续文档的备忘记录, 长期保存着关于计算机网络方面讨论的备忘录, 包括会议记录、概念、协议、过程、程序、评价等。它以纯文本格式保存文档, 不具备丰富的特性, 这种“干瘪”的数据成功地通过Internet上所有协议进行呈现。该仓储持续了40年, 今天我们依然能很容易地阅读到几十年前的文档。风干是数字保存策略的附加方案, 也是一种以防万一的策略。风干策略目前存在的问题是无法有效地提取有价值的隐藏的数据。

五、更新

信息技术发展快速以及媒体更新速度也十分迅速, 储存媒体的过时/老化, 或者是读取媒体的设备已经不存在, 储存媒体的信息资料不能使用, 所以要采取一种解决媒体功能消失的策略———更新。数据更新是将数字信息拷贝到新的媒体上, 保护数据本身不受存储介质质量恶化的影响, 即所谓“备份”工作。这样的策略可以说是目前较为普遍、简单的一种保存数字信息方法。如将磁碟片资料转到另一磁碟片上, 将九轨磁带转换到光碟片上, 但是这样的更新基本上每三年到五年要重做一次 (其更新的时间长短需要视储存媒体而定) 。将数字信息复制到新媒体上, 看起来可以完整地保存信息, 但是这样的方式也有一定的限制。更新的方式仍然需要特定的软、硬件, 以方便读取使用该信息, 所以其编码格式有一定限制。复制到哪一媒体还需要仔细考虑, 因为这涉及新旧技术的兼容性。所以采用此种策略一定要定期更新, 不然不能保证更新后的储存媒体可以继续使用。

六、标准化

标准化就是将数字资源转换成一种或多种主流格式, 可以供各样的系统和软件共享使用。此方法与更新及迁移方法类似, 唯此方法在数字资源的标准格式上。因此, 须考虑此标准格式是否有其保存格式的存在, 以及资料可能因格式的变更而有所损失或因修改而降低其原有意义。通常与其他策略方法搭配运用, 如与迁移策略配合, 在进行系统转置时, 必须要把资料作一标准化, 让所有资料都依照标准规格迁移到新系统, 因为若在迁移时, 资料没有先标准化, 资料很容易就会遗失或遗漏。标准化的优点:只需维护少量格式, 选择的格式可能更具生命力, 使用逻辑描述从而增加未来理解的可能性。但是, 标准化最重要的是选择出一个合适的标准规格, 其所使用的规格必须能够支援原始资料各方面功能。同时, 还要考量到其他一些问题, 如未来业界标准的制定、数位典藏标准规格、资料交换规格等。此外, 标准也会随着时间而有所改变, 这也是要引起注意的。

七、封装

信息封装技术是指对信息资源进行存储、传输、分发之前所进行的数据封装、压缩、分组编码等技术。封装就是对数字资源进行包装过程中, 将该数字资源所需的运行环境 (包括硬件和软件) , 如动态链接库一起打包, 从而实现在其他环境下运行该程序包[3]。如在JAVA程序中加入J2SDK, 从而保证在新的环境下的JAVA环境要求。再譬如基于封装技术的长期保存数字对象模型-VEO, 其最大的特点是它不但封装了元数据信息、信息内容, 还封装了认证及数字签名信息与方法, 从而实现数字对象自我访问控制和安全管理。此种方法最能保证数字信息的完整性并符合长久保存的要素, 似乎是很好的策略, 但由于刷新元数据存在困难, 因此实际上这种策略还需要进一步的研究。

八、重份

将数字资源重复一份, 异地存放或设立镜射场地 (mirror site) 是目前许多企业/组织的做法, 然而大部分都是着眼在安全问题或系统执行效能上, 而非着眼于数字资源的保存上。数字资源保存问题是一个复杂的问题, 保存策略的制定绝不仅仅是选择哪种技术的简单问题, 而是需要仔细分析数字资源保存所处的上下文环境, 识别影响保存策略的各种关键因素, 根据既定目标, 选择合适的保存技术, 形成一个可行的混合保存策略, 最终完成数字资源保存使命。

参考文献

[1]张智雄.数字信息资源长期保存技术体系研究[J].现代图书情报技术, 2006 (4)

[2]吴振新.数字信息资源长期保存技术策略分析[J].现代图书情报技术, 2006 (4)

冬天香菜怎么保存?香菜的保存方法 第4篇

冬天香菜怎么保存?香菜的保存方法

香菜是人们最熟悉不过的提味蔬菜,北方人称之“芫荽”,叶小且嫩,茎纤细,味郁香,是汤、饮中的佳佐。一般就做汤或者配菜的时候放一些进行提味,平时很少用,买多了后,放一两天就坏掉了,可是不买香菜,做汤或者拌菜总觉得不够鲜美。那么香菜该怎么保存呢?

香菜的保存方法

1、用小碗接一碗水,把香菜根泡在其中,放入冰箱冷藏,每2日换水一次,即可较长时间保存香菜。

2、将香菜根部切除,择去烂叶,黄叶,摊开晾晒一两天,然后编成香肠一般粗细的长辫子,挂在阴凉通风处晾干。或选带根的香菜,将黄叶摘掉,洗净后把香菜逐棵挂在细尼龙绳上(最好不要用麻绳)放在通风处晾干,然后将香菜取下放在容器内贮藏。食用时,用温水把香菜浸泡一会儿,香菜就依然保持绿色不黄,食之其味如初。

3、将香菜装入保鲜袋,同时放进一小块萝卜(胡萝卜或白萝卜皆可),再将保鲜袋扎紧放入冰箱冷藏室。

4、买带根的香菜,最好是粗根的,用一水杯,里装小半杯水,将香菜的根泡在水中,放在阴凉处,不仅不坏不焉,还可能长出新叶。

资源保存 第5篇

关键词  图书馆数字资源  长期保存  管理  现状  风险

一、图书馆资源的现状分析

数字资源的长期保存与管理问题成为了近年来图书馆研究与讨论的热门话题,各国对于图书馆资源的数字资源建设也都十分的重视。当然,我国也不例外。在图书馆数字资源建设,尤其是文献资源建设方面,我国投入了大量的人力、物力、财力。就国家图书馆来讲,在2005年就已经开始了数字图书馆工程的建设。截止2010年底,国家图书馆数字资源总量已经累计达到480TB,无论从内容还是种类上来讲,都十分的丰富、多样。目前国家数字图书馆资源不仅具有有型数字资源形态,还具有网络信息资源形态,因此对于数字资源检索的方式也存在着很多种,比如通过网络连接进行访问检索,又或者是通过局域网上的数据库进行检索等。

二、图书馆数字资源的长期保存与管理存在的风险与管理

图书馆数字资源因为本身形式、内容等的复杂性,决定了对其进行长期保存与管理所不可避免的风险性。对于图书馆数字资源来讲,为了能够更好地规避风险,不仅要从技术上制定策略,还要制定管理策略。

(一)图书馆数字资源长期保存与管理所面临的风险

对于图书馆数字资源的长期保存与管理来讲,其可能面对的风险由软硬件故障所带来的风险、管理漏洞以及经济风险、法律风险等。从软硬件故障上来讲,其可能面对因为时间的过长而出现存储介质的损坏或者过时,最终导致硬件在通信时出现网络故障等,还可能面对不能从原来的存储格式中读取数据信息的风险。

图书馆数字资源的长期保存工作是一个持续的、动态的过程,在图书馆数字资源长期保存过程中需要保存数字信息本身及其相关技术、方法和工具,包括保存数字格式、数字比特流、数字处理信息等,而这一切的活动都是需要巨额的经费支持的。因此从这方面来考虑,数字资源的保存比传统的纸质文献更需要经费的支持,而且对于经费的依赖性更强。所以在进行图书馆数字资源长期保存系统的经费预算时,要考虑到各种费用,而又因为很多费用并不是一成不变的,所以说图书馆数字资源保存系统的成本预算是具有不可预测性的。而且不论是哪一个环节的经费不到位,都会导致整个系统的瘫痪、崩溃。从这里来看,图书馆数字资源长期保存系统又是相当脆弱的。

(二)对于图书馆数字资源长期保存与管理存在的风险的管理策略

图书馆数字资源长期保存与管理存在着各方面的风险,为了能够使得保存活动能够顺利的进行,首先要进行科学的管理。第一,要能够建立审核制度。因为图书馆数字资源保存系统无论是从开发、使用,还是从维护上来讲,都是需要巨额的经费支持的,所以不可避免的会出现经济风险。为了能够将经济损失降到最低,就要建立对于数据内容的审核检查机制。第二,建立责任体系。通过制定相关的法律、政策,明确作者以及图书馆、用户和数据库商之间的责任和权利,通过管理机制来对各方进行监督,保证管理活动能够顺利的开展。

三、图书馆数字资源长期保存与管理之间的体系的构建

(一) 图书馆数字资源长期保存与管理责任体系的基本内容

在图书馆数字资源的管理上存在着很多的联系,在资源提供的时候则需要向资源提供方提供签订协议,需要资源提供方对协议中的合理与合法负起重要的责任。资源提供方必须了解并且遵守签订的协议中的内容,保证所提供的数字资源内容是真实、完整而且安全有效的,再提供的数字资源中不能存在加密的措施。对于资源保存的一方来讲是需要存储者来完成此项任务,在资源提供方提供的数字资源,存储方要按照相关的责任来保存好提供的资源,包括资源的接收以及对资源的审核,来确保提供的资源是可靠的、安全的、真实的。对于保存的数字资源图书馆一定要将资源授权给用户以实现数字资源所带来的价值。图书馆可以开发更多的服务功能或服务的项目,但是图书馆一定要严格的注重自身中服务的功能,图书馆是以服务为目的的,并不注重盈利。

(二)图书馆数字资源长期保存与管理之间的责任体系的管理策略

图书馆的长期保存与管理,各个部门都要做积极的相互配合来做好自己的工作,并且要主动的去遵守以及做好自己相应的全力权力以及责任与任务。这就需要开一些相关的宣传活动来提高各部门以及各方责任的认知以及知识水平。图书馆一定要积极的去开展一系列的有意义的活动,因为在各个图书馆中普遍存在着对于图书馆中数字资源管理的缺乏,并不清楚数字资源长期保存的工作,也不知道图书馆数字资源长期保存中存在着那些权力、责任与义务,并且还有许多出版商也不赞同开展相关的活动,这就使得图书馆中资源的管理面临着许多的问题。在这样的网络时代,数字信息的长期保存对国家的文化、教育与社会都是一项重要的发展数字化科学的基础,而图书馆以及档案管理室等文化的机构都保存着电子档案和会议论文等至关重要的数字化的信息。

四、结论

随着信息需求量的不断增大,图书馆这个信息资源聚集地的数字资源信息量也在急剧的增加。由于数字资源的急剧增长,使得数字资源的长期保存和管理中所面临的各种问题也不断突显出来。为了能够充分的发挥出现代图书馆的优势,图书馆要做好数字资源的长期保存与管理工作,肩负起保存数字资源的历史使命。

参考文献:

[1]江洪,於维樱.国外最新图书馆资源建设与信息服务战略研究——一种基于战略规划文本的分析[J].图书馆建设,2012(8)

[2]马晓晨,李永先.图书馆数字资源长期保存问题研究[J].甘肃科技,2012(7)

美国数字资源长期保存研究 第6篇

一、影响数字资源长期保存的因素

数字资源的长期保存是一个系统工程,数字资源长期保存能够顺利进行是各方面因素相互影响的结果,它的实施不仅受技术因素的影响,更多的是非技术性因素,如公共标准、相关法律、经济条件和保存政策等。只有对影响数字资源长期保存的所有影响因素进行分析,才能制定出更有效的保存策略,保证数字资源长期保存工作顺利地完成。

1. 政策问题。

数字资源长期保存是一项非常复杂的社会性工作,需要国家的支持,需要全社会的共同参与。如果没有国家政策的正确引导,数字资源长期保存工作将不会得到足够的重视,难以调动各相关利益主体的积极性,就不能形成全社会范围内数字资源长期保存的良好合作局面。

2. 标准问题。

标准是保证数字资源真实性、可靠性、有效性的必要手段。数字资源长期保存工作涉及数字资源整个生命周期,每一个进程都需要标准的支持。因此,在数字资源长期保存过程中建设相关标准体系非常必要。数字资源长期保存中主要涉及的标准有数据层面的标准、系统层面的标准和业务层面的标准,如长期保存系统、数据(文件)格式、数据转换、数据编码、数据标识、元数据等等。

3. 经济问题。

数字资源长期保存的很多工作都需要大量的资金支持,如数字资源的不断迁移、长期保存系统的搭建、标准的制定、人员的培训等等。然而,总的来说,长期保存工作究竟需要投入多少,如何建立一个可持续发展的资金支持体系,是每一个国家和机构都需要解决的问题。

4. 法律问题。

数字资源长期保存涉及的利益主体较多,各个环节都需要相关的法律法规进行约束和调整。数字时代,立法倾向于加大对版权人权利的保护,缩小合理使用制度的适用范围,这十分不利于数字资源的长期保存。如何在保护版权人合法权益的情况下实现数字资源的长期保存,成为必须解决的问题之一。

5. 技术问题。

(1)就目前来说,数字资源长期保存的载体主要是光盘,而光盘的寿命一般是五到十年,有效期较短。(2)和载体相比,技术进步对数字资源的长期保存影响更大。有时,留存信息的载体是有效的,但是能读出它们的硬件系统或者软件系统却已经消失了。(3)仿真、拷贝和迁移都是数字保存领域里的常用技术,但是目前这些技术在数字资源长期保存应用过程中都存在不同的缺陷。

二、美国数字资源长期保存工作经验

1. 政府主导,整合社会力量。

美国政府认为,保证数字资源能长期有效保存,是全社会的事情,需要社会力量共同参与。因此,建立了以政府为主导,社会机构和私人组织共同参与,民主监督,广泛合作的分工保存形式。在美国政府的支持下,其数字保存工作开始形成了众多社会主体共同参与的、全社会方位内的广泛的合作局面。1994年12月,美国保护与存取委员会与美国研究图书馆共同组建了数字存档特别工作组,该工作组完成了《保护数字信息:数字信息归档特别工作组报告》。2001年11月,美国国会图书馆召集近七十名各行各业的代表参与讨论,出谋划策。他们来自于专业协会、娱乐界、电影、音乐、图书馆、档案馆、报纸、杂志、出版、软件等行业,有的代表还具有多种职业背景。会议通过讨论,大家一致认为,只有形成人人主动保存数字信息的意识,数字资源的保存才可能是全面的、有效的,才能形成一种广泛的社会行为。

2. 制订了数字资源长期保存标准体系。

美国建立了比较完善的数字资源长期保存标准体系,处于世界领先水平。具体包括,美国国家档案馆标准:《信息交换格式标准》《扩展可接受的记录移交需求:移交永久电子记录—扫描图像文本记录》《文本记录的图像扫描件需永久保存时移交规则》《扩大可接受的记录交移需求:移交永久性网络内容记录》《电子记录保管业务流程分析和系统设计标准》《电子记录管理系统和电子档案管理系统集成框架》《可信电子记录管理信息系统开发指南》《记录管理指南———PKI数字签名真实、安全迁移记录指南》;美国国会图书馆数标准:《电子图像记录管理元数据XML Scheme》《基于XML档案机读目录格式》;其中,美国国家航空和航天局和太空数据系统咨询委员会联合制定的标准《开放档案信息系统》,2003年作为ISO标准(ISO14721:2003)推行。

3. 建立了资金支持渠道。

美国的数字资源长期保存项目受到多方支持,建立了比较完善的资金支持渠道。美国数字资源长期保存的经费主要来自于政府机构、非盈利组织等。如美国国会责成国会图书馆联合相关国家机关、团体、私有机构等共同致力于“国家数字信息基础结构和保存规划”,并为其投入1.75亿美元经费;美国国家科学基金、美国国会图书馆和安德鲁·梅隆基金会等都对美国斯坦福大学图书馆的多备份资源保存项目进行了资助。

4. 完善了相关法律。

(1)美国对数字资源长期保存作出了明确的法律规定,提供了有利的法律保障,确保长期保存的各项工作得以顺利开展。美国现行版权法第108条(c)款规定,图书馆、档案馆可以“为了代替损坏、恶化、丢失、被盗或者存储格式已经过时的馆藏作品(包括数字作品)的目的,对一份已经出版的作品制作三份复制件”。(2)美国国会为了促进数字资源长期保存工作发展制定了专门法案。2000年12月,美国国会通过了一项立法(Public Law 106-554),即建立国家数字信息基础结构和保存规划,并配套了专门负责的机构与相应的项目经费。

5. 重视技术研发。

美国数字资源长期保存工作非常重视技术的可靠性和安全性,积极研发数字资源长期保存专用技术,其仿真、迁移、再生性保存等技术都处于国际领先水平。同时,美国数字资源长期保存工作也强调技术的实用性,比如,洛克希勒·马丁公司参与了美国国家档案和文件管理局的电子文件档案馆项目;斯坦福大学图书馆的多备份资源保存项目开发出作为建设数字馆藏手段的开放源代码存档软件;哈佛大学和斯坦福大学联合开发了长期存储系统潜故障和可见性故障的分析模型。

三、对我国数字资源长期保存的启示

1. 制定数字资源长期保存专门政策。

数字资源长期保存是一项耗时长、多层面、费用高的系统工程,不可能只依靠一个机构来完成。我国应该制定系列专门政策,明确国家在数字资源长期保存方面的意图,整合相关政府机构和社会力量,调动相关利益主体的参与积极性,使数字信息从产生到保存、从利用到维护的整个生命进程都得到行之有效的管理和利用,从而降低长期保存的成本,减少数字资源的失效和损毁。

2. 构建数字资源长期保存标准体系。

标准体系是数字资源长期保存不同系统之间数据互操作的基础保障。我国在构建数字资源长期保存的标准体系过程中,可以借鉴已有的先进国际标准、国外标准,同时也要考虑我国管理体制和机制的特殊性,基于数字资源全生命周期管理需要,制定数字资源保存标准体系的目标,整合社会多种力量,共同建设可操作性、开放性和扩展性优秀的标准体系。

3. 建立可持续发展的资金支持体系。

数字资源长期保存需要大量的资金投入,如果没有一个可持续的资金支持体系,数字资源的保存不可能有效实施。我国可以主要采取财政专项的方式给予经济上的支持,同时辅以其他形式,比如,建立数字资源长期保存直接相关的专项基金、在各种科研项目基金中重点支持长期保存相关项目、建立数字资源长期保存奖励基金等。

4. 完善数字资源长期保存的法律。

(1)我国可以借鉴美国等其他国家的做法,修改现行的、不利于数字资源长期保存的相关法律条款。比如,调整《知识产权法》,允许数字资源保存机构为了长期保存,而对数字信息合理复制及格式转换,允许数字信息在迁移过程中发生的某种变更。(2)我国可以出台数字资源管理的相关法律,确定国家信息资源规划、收集、建设、保存、开发、利用、保护的一系列原则、制度,并在其中表达数字资源长期保存的国家意志,明确长期保存相关主体的权利、利益和责任,保障长期保存工作持续、快速发展。

5. 积极开展数字资源长期保存研发技术。

技术研发要重视实用性,目前,迁移和封装是被普遍认可的技术,我国可重点加强对于这两种技术的研发、数字信息载体的研发,以及通用数据格式转换平台的研发,同时可以委托信息技术公司进行长期保存系统与技术的研发。在取得相应研究成果之后,相关部门可以通过制定标准或者推荐最佳实践的方式尽快普及推广。

参考文献

[1]谢永宪,杨菊.数字资源长期保存影响因素多层次分析[J].北京档案,2012(5).

[2]谢永宪,刘航,袁晓雪.澳大利亚电子文件长期保存策略及其启示[J].北京档案,2013(5).

[3]吕志梅.国外数字资源长期保存的现状、问题及对我国的启示[J].现代情报,2008(5).

浅谈数字资源的保存策略 第7篇

一、系统保存

系统保存, 就是将数字信息以其最原始的格式储存, 并且将计算机系统也保存起来。它既可以只保存硬件或应用软件, 也可以将软硬件都保留下来。虽然这是保存数字资源最简单的方式, 只要保存计算机系统, 就可以维持数字信息的可用性, 可是必须一直将过时或很快被淘汰的系统保存起来, 成本高且需大量存放空间。一般而言, 这个策略不能维持太久, 只适用于短时间保存。

二、数据迁移

数据迁移是根据软硬件的发展将数字资源迁移到不同的软硬件环境下, 从而保证数字资源可以在发展的环境中被识别使用和检索, 进行数字信息的长期保存。当数据格式过时或发生其他情况时, 利用迁移工具将原始的数字对象迁移到新的数据格式下, 可保证数据在新平台环境下的可用性。根据迁移条件的不同, 迁移可以分为硬件迁移、软件迁移、版本迁移、格式迁移、载体迁移及访问点迁移。目前, 迁移技术被美国保护与存取委员会和美国研究图书馆组建的数字信息档案特别工作组认为是解决技术过时问题的良策, 国内许多人也认为数据迁移是数字信息长期保存的较优的选择。但是, 迁移方法存在着一些不足, 如每一次迁移都可能丢失一定的结构、版式、链接、交互关系等信息, 影响以后的迁移, 从而产生不同程度的失真;迁移无法准确地保存和提供可信赖的还原机制;迁移时需要相应的迁移工具也会造成相关费用的提高。因此, 迁移法或许不是最好的选择。

三、仿真

仿真技术是保存策略的一种, 不但可以确保资料不会遗失, 还可以使得资料的功能在计算机上完全呈现。数据仿真就是一个计算机系统对另一个计算机系统部分或全部的模拟, 使模拟的计算机系统与被模拟的计算机系统接收相同的数据、执行相同的程序、获得相同的结果。虽然不能以模拟的方式来保存所有的文件, 但事实上这个方式可以让文件精准的重生。仿真允许文件的最原始的应用软件不一定在最原始的系统中运作。就理论上而言, 仿真设备可以包含所有的资料和解释资料及重要的应用软件, 所以只要保存了模拟器就等于保存了完整资料。利用软件来模拟被保存的数字信息, 对技术要求较严格, 须对该软、硬件及其运作十分熟悉, 否则只要稍微有些偏差即无法达到保存目的。

四、风干

在数字保存领域中, 风干是指从复杂数字对象格式中提取有价值的内容, 保存简单、低技术含量、机器易于还原和被人理解的数字对象格式的过程。基于风干的策略, 就是在保存数字对象的原始版本之外, 还需要保存一个简单、低技术含量、经过干燥处理的数据版本。这种风干数据在很多中长期保存的数字格式中得到了检验, IETF的RF-Cs的仓储就是一个重要的例子。RF-Cs是一套关于Internet技术和组织说明的仓储, 从1969年开始成为RFC连续文档的备忘记录, 长期保存着关于计算机网络方面讨论的备忘录, 包括会议记录、概念、协议、过程、程序、评价等。它以纯文本格式保存文档, 不具备丰富的特性, 这种数据成功地通过Internet上所有协议进行呈现。风干是数字保存策略的附加方案, 目前存在的问题是无法有效地提取有价值的隐藏的数据。

五、更新

数据更新是将数字信息拷贝到新的媒体上, 保护数据本身不受存储介质质量恶化、读取媒体设备更新的影响。这样的策略可以说是目前较为普遍、简单的一种保存数字信息方法。如将磁碟片资料转到另一磁碟片上, 将磁带转换到光碟片上, 但是这样的更新基本上每3~5年就要重做一次。将数字信息复制到新媒体上, 看起来可以完整地保存信息, 但是这样的方式也有一定的限制。更新的方式仍然需要特定的软硬件, 以方便读取使用该信息, 所以其编码格式有一定限制。复制到哪一媒体还需要仔细考虑, 因为这涉及新旧技术的兼容性, 所以采用此种策略一定要定期更新, 不然不能保证更新后的储存媒体可以继续使用。

六、标准化

标准化就是将数字资源转换成一种或多种主流格式, 可以供各种系统和软件共享使用。此方法与更新及迁移方法类似, 通常与其他策略方法搭配运用, 如与迁移策略配合, 在进行系统转置时, 把资料作标准化处理, 让所有资料都依照标准规格迁移到新系统。标准化的优点:只需维护少量格式, 选择的格式可能更具生命力, 使用逻辑描述从而增加未来理解的可能性。但是, 标准化最重要的是选择出一个合适的标准规格, 其所使用的规格必须能够支援原始资料各方面功能。同时, 还要考量到如未来业界标准的制定、数位典藏标准规格、资料交换规格等问题。

七、封装

信息封装技术是指对信息资源进行存储、传输、分发之前所进行的数据封装、压缩、分组编码等技术。封装就是对数字资源进行包装过程中, 将该数字资源所需的运行环境, 如动态链接库一起打包, 从而实现在其他环境下运行该程序包。如基于封装技术的长期保存数字对象模型VEO, 其最大的特点是它不但封装了元数据信息、信息内容, 还封装了认证及数字签名信息与方法, 从而实现数字对象自我访问控制和安全管理。此种方法能够保证数字信息的完整性并符合长久保存的要求, 但由于刷新元数据存在困难, 还需要进一步研究。

八、备份

将数字资源重复一份, 异地存放或设立镜射场地是目前许多企业、组织的做法, 然而大部分都是着眼在安全问题或系统执行效能上, 而非着眼于数字资源的保存上。数字资源保存问题是一个复杂的问题, 保存策略的制定绝不仅仅是选择哪种技术的简单问题, 而是需要仔细分析数字资源保存所处的上下文环境, 识别影响保存策略的各种关键因素, 根据既定目标, 选择合适的保存技术, 形成一个可行的混合保存策略, 最终完成数字资源保存使命。

参考文献

[1].张智雄.数字信息资源长期保存技术体系研究[J].现代图书情报技术, 2006.4

资源保存 第8篇

关键词:档案信息资源,网络,收集,保存

目前在社会不断发展过程中,其内部涉及的档案信息也逐渐增多,针对于这种情况出现可以看出单纯的采用传统的档案信息管理是根本不够的,这就需要在原有的基础上开展有效的网络档案管理。在目前实施的网络档案管理主要可以概括在三个当面。包括档案自身信息、与档案有关联的信息和档案信息使用过程中采用的网络系统软件。对于这三个方面来说,其对档案管理的实施起到不可忽视的作用。因此要想全面保证网络档案信息管理的顺利进行,就需要对这三个方面起到高度重视。

1 网络档案信息资源的收集保存范围和保存时间

对于网络档案信息管理来说在进行的时候还需要对档案自身的相应信息有一个全面的考虑,在这个过程中需要对档案自身信息归属做出合理的分类。在进行网络档案信息收集和保存的过程中与传统的档案管理方法并没有太多的差异,主要在于对一些信息涉及的元件和可以参考利用的档案信息进行有效收集。对于这些对社会发展有研究意义的文件和档案应该将其保存在国家档案局内部,这样不仅仅在需要的时候方便查询,而且对于档案自身安全性提升也起到非常重要的作用。在对档案实施网络技术保管的时候还需要对档案自身特点进行全面研究,并根据档案特点和相应属性进行有效划分,从根本的角度上促使网络档案管理更加顺利的进行。

网络档案自身保存时间不仅仅需要你按照相应的档案规定进行有效划分,还需要对档案保管软件自身特点进行全面概述。在笔者对网络档案管理进行深入研究中,发现在目前社会发展的过程中实施有效的网络档案管理需要对其收集和处理的时间做出一个合理的规化,并对档案涉及的元数据和重要的资料文件进行合理的收集和保存,从根本的角度上促使网络档案管理更好的进行。在进行档案管理的时候还需要按照相应规定对档案管理的方法和时间做出合理调整,并对其中涉及的资料信息有一个全面的了解,这样能够在保证网络档案顺利实施的过程中,还能够对档案管理中出现的问题做出及时有效的解决。

2 网络档案信息资源的收集和保存要求

网络档案管理实施的根本目的就是采用网络技术手段对相应的信息进行有效的收集和保存,这样对提升相应资料的用处,促使社会得到更好的发展起到非常重要的作用。但是在进行网络信息资源的收集和保存的过程中还需要对其中涉及的要求起到高度重视,保证档案在实际工作中的完整性和可靠性。在实际工作中除了需要采用适当的方法保障档案信息自身完整性和稳定性,还需要保证在进行实际工作的时候能够对档案自身规律和特点做出有效控制,使得其自身存在的特点和相关要素能够充分的体现出来,并为网络档案的保管提出有效的参考依据。在对档案实施有效管理的过程中还需要对档案自身涉及的变化性因素有一个全面的考虑,主要因为不同的档案在类型和功能上也存在着很大的差异,这种情况就增加了档案管理的复杂程度。因此在实施网络档案管理大的时候就需要按照相应要求进行档案管理,从根本的角度上促使网络档案管理更好的进行。

3 网络档案信息资源的收集保存策略与技术

当前我国的网络技术越来越强大,同时在档案机构运行的过程中所面对的环境也比较复杂,技术方面的要求也越来越高,所以在这样的情况下,要想为网络信息资源的收集和保存提供更多的唯一性指导是非常难的,在技术层面我们主要可以采取以下几项措施:

3.1 对象驱动

这种方法在应用的过程中侧重点主要是利用对象和与之相关的元数据,这种方法比较适合使用在HTML文档的集成工作中,同时它也不需要借助互动性的网站作为其发展的平台。采用这种方式可以很好的对网络资源实际的变化情况进行适当的了解,同时还能够对一些独立的网络资源进行实时的了解,同时在工作中还可以根据实际的需要去重建网站。

3.2“快照”

“快照”通常是在某一时刻生成的完整准确的网络资源文件拷贝。我们可以将该“快照”收集到机构文件保管系统,并根据利用时间的长短来决定其保管期限。当我们对网络资源集合进行快照时,必须尽可能地确保对网站及其构成网页进行不间断处理的能力。这意味着各机构应该努力保持通过技术平台复制网站内容、层次和功能,同时没有损害数据完整性的能力。

该策略通过开展风险评估来确定生成拷贝和归档的频率,具有较强的可操作性。“快照”属于对象驱动方法,它对于静态网络资源特别有用,而不应该将它用于保管高度互动的动态性网站或资源(数据库、事务处理服务)。该方法的不足在于,一个“快照”只能提供某个网站在某一时刻的“照片”。如果捕获的“快照”缺乏其他网络活动文件的话,它就不可能完整重建某一时刻的网站及其功能。由于这种收集保存方法无法使机构准确确定何时能够获取网站资源,因此,采用“快照”策略的机构还需要生成和保管两个“快照”之间的网站资源变化日志。为了确保能够完整地重建网站功能,一个“快照”应该包括网站的所有方面,即包括脚本、程序、插件和浏览器软件等所有能够使“快照”充分有效的组件。

3.3 跟踪变化

本方法涉及到跟踪某段时间内网络资源的变化,并生成变化或活动日志。为了满足利用需求,我们需要将活动日志收集到文件保管系统进行管理维护。如果与网络资源“快照”结合使用的话,本方法将是保管静态网站的可靠选择。跟踪变化方法所产生的主要问题是,如果活动日志的元数据不完整,那么就会导致无法解释过去的日志。因此,至关重要的是要明确元数据要求,文件保管系统所收集的元数据要完整、充分。我们可以使用不断出现的网络技术来跟踪网站变化。

结束语

在现在社会科技技术的不断发展过程中,网络技术在我国档案管理上也发挥了非常重要的作用。但是在采用网络技术进行档案收集和保存的过程中还需要结合管理人员自身转变思想,这样对促使档案管理更好的进行起到非常重要的作用。

参考文献

[1]庞博,彭丽娟.网络博客的档案价值初探[J].档案学研究,2009(04).

[2]郑惠萍.谈网络管理机制中档案信息资源的收集与保存[J].郑州铁路职业技术学院学报,2009(02).

数字资源长期保存的方法及成本分析 第9篇

在数字资源保存中, 需要保存数字信息本身及相关技术、方法和工具, 包括保存数字比特流、保存数字格式与处理信息、保存数字信息处理环境、保存数字信息的验证和管理机制、保存数字信息的组织和利用环境等。这些均需要成本核算与因素分析。成本核算分析, 主要是利用成本核算及其他有关资料, 全面分析成本水平与构成的变动情况, 系统地研究成本变动的因素和原因, 挖掘降低成本的潜力。通过分析, 可以正确认识和掌握成本变动的规律, 有利于实现降低成本的目标, 并为编制成本计划和制定新的经营决策提供依据。对数字保存成本进行分析可以明晰各种费用支出, 合理调配各种资源, 为寻求降低成本的方法提供一些思路。数字资源长期保存的成本一般包括:固定成本、技术成本、基础设施建设成本、人员成本、组织管理成本、可变成本和更新资源成本。

一、选择数字资源的不同保存方法

目前常用的两种保存方法是迁移和仿真。迁移是把数字信息定期从一代计算机上迁移到新一代计算机上, 仿真是对原始软硬件、操作系统的模仿, 从长期保存来看, 这两种策略都是很昂贵的。使用迁移法对数字资源进行格式转换的代价较高, 仿真法需要的是更多的初始投资。迁移法的实施对象不是一个数字资源的整体, 而是单个对象, 需对集合中的每一个数字对象单独进行转换, 因此迁移法的费用与需要转换的数字资源集合的规模有直接关系, 规模越大, 所需费用越多, 而仿真工具是应用在一个数字资源集合的整体, 其使用费用不受数字资源集合规模的影响。保存策略将对数字资源生命周期的管理及所需的相关费用产生非常重要的影响, 反过来, 保存费用的预算也将决定或限制保存策略的选择, 对一个具体的机构而言, 是采用迁移法还是仿真法, 要视机构的保存时间、保存目标、资金等具体情况做出选择。

二、数字资源保存的成本因素

1.物理环境方面。物理场所主要包括安放服务器和相关设备的空间、足够的办公室空间、安全防护设施 (如防静电地板、防盗装置、空调系统) 等。数字保存活动需要在一定的空间场所实施, 对环境条件要求较高, 这部分开支是必需的。服务器用于数字文档的储存和长期保存的管理, 把开发、测试和生产等各种设备分开安装, 可以减少风险、提高效率, 但相应地会增加保存成本。

2.硬件方面。主要包括以下成本:存储数字文档的服务器, 磁带、磁盘或其他存储介质, 备份设备, 网络通信费用等。文档的保存需要硬件设施, 如果对需要存储的文档规模有大致的了解, 就可以对购买存储介质的成本进行评估, 以便有足够的预算来配置相应的存储设备。保存系统接收来自不同地方的大量数字文档, 需要高速的线路或灵活的、能够容纳不同负荷的线路, 因而网络设施也是很重要的不容忽视的成本。

3.软件方面。主要包括操作系统、安全管理软件、文档管理软件、新/旧应用软件、显示程序、通信软件、数据库使用许可等费用。这一部分涉及购买操作系统的问题, 同时需要系统保护软件 (防止病毒以及未授权的获取等) , 也需要具体的软件来获取和存储数字记录。另外, 每一个进行数字保存的机构, 不管其规模大小, 都需要文件管理系统 (Document Management System, DMS) 或文档管理应用软件 (Records Management Application) 。存储系统要提供对存储文档的获取功能, 这就要求除了普通的存储软件外, 还需要具体的应用软件或显示软件, 以便用户能显示或使用存储的记录。在准备这些预算时, 也不要忽视通信软件和网络数据库使用许可费用。

4.人员成本。人员是一个很大的成本影响因素, 对不同的知识库进行成本分析的结果一致表明, 人员成本占总体成本的69%-82%。数字保存的整个过程都离不开人员的参与, 不同的工作需要相应的工作人员担负不同的任务。数字保存不仅需要专家, 也需要管理人员、信息技术人员、提供服务的人员等。

保存脐血:保存一份希望 第10篇

受访嘉宾二:北京市脐带血造血干细胞库业务负责人 邓钺

(注:本刊记者分别采访两位嘉宾)

保存脐带血早已经不是什么新鲜事了。准妈妈一般会在产前的孕妇学校了解到保存脐带血的信息,但是,因为缺乏对脐带血全面和科学的认识,是否保存脐带血仍然是让很多准妈妈左右为难的事情。为难的原因大致分两类,一是相对于近2万元的自存费用和低概率的重大疾病发生率,保存脐血到底值不值得;二是保存后,看不见摸不着,长期不管不问,脐血库是否能保证其保存和管理的质量。

脐血的利用,不只白血病

大众健康:对于公众来说,了解脐带血的机会不是很多,有人认为脐血只能治疗白血病。

刘开彦:保存脐带血是为了保存脐血中的造血干细胞。而造血干细胞所治疗的疾病不仅仅是白血病。目前,国际上利用脐带血治疗过的疾病已经有80多种,我国目前利用脐血参与治疗的疾病也已经有30种以上。1996年,北京大学人民医院、北京大学血液病研究所建立了中国首家脐带血造血干细胞库。2000年,北京脐血库向北京大学人民医院提供了第一份脐带血用于临床移植,成功救治了一名非霍奇金淋巴瘤患者。时至今日,仅北京脐血公共库就已经利用脐血治疗了500例之多。全国北京市、天津市、上海市、山东省、广东省、浙江省、四川省共7个脐血公共库,目前已累计提供了2000份脐血用于疾病的治疗。截至2013年底,全球脐血移植超过38000例,绝大多数为非血缘造血干细胞移植。随着医学的发展,应用脐带血造血干细胞治疗的疾病种类会越来越多,技术也会越来越成熟。

所以,保存脐血实际上是保存了一种希望,这种希望会随着医学科技的发展而越来越丰富。保存脐带血造血干细胞不仅对个体是储备或保险,对于血缘相关的亲属或用于公共库捐赠都有很好的应用前景和价值。

邓钺:保存脐血与买保险有相似的地方。有车一族年年都会为爱车购置保险,但不见得年年都会用到车险。脐血也是一样。不是为了将来一定会用到而保存,而是为了以后需要的时候有可用。要知道,虽然白血病的发病率为每10万人约3人,但是对于那些不幸罹患疾病的家庭来说,几率就是100%。所以是否保存脐血还是取决于公众的认识。

大众健康:对于脐血的认识,很多准妈妈没有得到准确信息的途径,而网上的信息很多都是片面的,以致于很多准妈妈存有各种疑虑。比如,我在一个人气颇高的母婴论坛上,就曾看到有人很肯定的发帖称,自体移植脐带血尚无成功先例。利用异体脐带血移植是已经得到临床验证的医疗手段,但自体移植获得成功的,全世界尚无一例报道。

刘开彦:1998年国际上就有自体脐血移植的报道,目前,全世界已有上千自体脐血治疗的病例。2009年,我国成功进行了第一例自体脐带血移植,治疗的疾病为神经母细胞瘤,也是亚洲的首例。这也是北京脐带血造血干细胞库首例储存的脐带血成功用于临床。我记得是2009年4月,一名2岁的儿童在北京儿童医院接受了移植手术。

邓钺:我们北京市脐血库已经成功进行了9例自体脐带血的移植。去年,我们成功进行了第9例、同时也是我国年龄最小的自体脐带血移植。一名出生仅3个月的小婴儿被确诊患上了急性未分化型粒细胞白血病。因为孩子年龄太小,所以一度被怀疑为先天性白血病。但幸运的是,通过提取脐带血样本,最终确定孩子所患的并非先天性白血病。2013年7月,孩子在首都儿科研究所接受了移植。我还记得,孩子的妈妈在看到我们的工作人员送去救命血时,写下了“多亏当时留了脐带血”的字条,她透过厚厚的玻璃窗,含着眼泪一直在点头。

大众健康:这个案例真感人!看来,各位准妈妈真的不能随意轻信网络信息。刚才碰巧二位所提到的脐带血移植都是婴幼儿,我也听过一些信息,说脐带血移植只适用于10岁以下儿童,因为脐带血的数量有限,每一个产妇的脐带血大概也就是50~80ml,根本不足以用于成人的治疗。 这个信息是否也不甚准确?

刘开彦:是的。10年之前,北京大学人民医院首份脐带血成功用于临床的同年,也就是2000年,北京市脐血库向北京大学人民医院提供了双份脐带血,我们成功救治了一名体重95公斤的白血病患者。这也是我国首例成功移植双份脐带血造血干细胞的病例。目前成人的脐血移植,无论国内还是国外,均以单份脐血为主。

大众健康:95公斤!那不但是成人,而且将近200斤体重的成人,是个质量偏大的成人呀!那是不是成人的治疗都需要双份脐血呢?

邓钺:也不尽然。有的成人只要一份也可以成功,也有孩子需要双份的。这要具体看所患的疾病和治疗手段。

大众健康:刚才刘主任也提到,储存脐血不仅仅是对将来个体应用,对于血缘相关的亲戚也很有应用的可能。这个怎样理解呢?

刘开彦:就是指脐带血配型时HLA A 、B、DRB1 6个点位的相合度。对于孩子来说,脐带血与其100%相合,与孩子的父母为半相合,与孩子的兄弟姐妹25%半相合,25%几率全相合。对于异体脐带血移植来说,只有相合度达到一定程度后,才能够进行手术移植。

大众健康:我们有没有为亲属提供脐带血的成功案例?

邓钺:2008年,一位四川的李女士在怀孕37周时被检查出患有白血病。家人对她隐瞒了病情,曾劝她放弃怀孕接受治疗。医生得知此情况后,建议患者家属将孩子的脐带血储存到北京市脐血库,以便为日后进行移植治疗时使用。当年12月,李女士顺利进行了剖宫产手术,并采集了70毫升的脐带血。生产后,医生开始为她寻找合适的骨髓,但最终也没找到配型完全相合的骨髓。于是医生建议用患者父亲配型半相合的骨髓进行移植。为了降低父亲半相合骨髓移植的风险,需要使用孩子留下的脐带血进行辅助治疗,来降低排异反应。2009年1月。李女士成功接收了手术。移植1个月后,李女士病情逐渐好转。原本AB型血的她竟然变成了跟父亲一样的B型血,说明她的造血系统已经重建。

nlc202309030641

除了自存,您还可以捐献

大众健康:很多准妈妈也是考虑到自存费用所以有所犹豫。目前我们的费用是多少?

邓钺:目前,在我们北京脐血库的自存费用为19800元。

大众健康:这也不算个小数字了,那这19800都包括哪些费用呢?

邓钺:我们采集、制备和检验的费用是6800元,其余都是年度保管费,每年980元,一共18年。当然,也可以采取按年的方式来缴纳保管费用,跟分期付款似的。

大众健康:除了自存,也可以进行捐献。那捐献和自存在采集程序和储存上有什么不同吗?

邓钺:没有什么不同,都是一样的。在孕妇学校的宣传也是一样的,都是想让大家能够充分认识脐带血的价值。产妇签署了知情同意书之后,会拿到一套采集的器皿,然后进产房之后直接交给大夫就可以了。我们的储存条件也都是一样的,没有自存和捐献之分,都保存在同样的条件和环境下,完全一模一样。虽然捐献的脐带血存在公共库,自存的脐血存在自存库,但这都只是名称上的不同,在档案记录中有所区分,而实际的存储都是同样的。

大众健康:捐献脐带血的捐者可以获得怎样的利益?

邓钺:捐者会得到一份自愿捐献脐带血的证书,今后在其本人和亲属需要时,都可以得到脐带血的优先配型权。

大众健康:那在捐者需要时,是否也可以使用自己捐出的那一份脐带血呢?如果可以,这样跟花钱自存有什么区别?

邓钺:捐献就不是自己的了。就是说,如果是捐献,脐带血的所有权在血库,捐献者仅仅是有脐带血的优先配型权,不一定能够使用到自捐的脐带血,而且还需要支付相应的配型、使用费用。但如果是自存的,那么脐带血的所有权属于自己,无论何时、如何使用、给谁使用都可以由自己支配,而且无需额外支付配型和使用费。

刘开彦:的确有很多家庭是怀着这种侥幸的心理来进行捐献的。捐献出来的脐带血有可能由以下几种途径消耗掉。一是临床。我们2007年加入了中华骨髓库,将公共库所有数据纳入中华骨髓库数据配型业务,共用检索查询平台,共同为患者和医院提供检索查询服务。数据都是公开的,所捐献的脐带血有可能被需要的患者配走。二是我们每年都要向科研单位提供脐带血来进行科学研究之用。这部分脐血也出自公共库。三是每年我们会随机抽取脐血进行质检,以确认我们的储存质量。所捐出的脐血也有可能被抽到。

当然,如果很幸运,捐献者需要帮助时,所捐出的脐血刚好没有消耗掉,还在我们脐血库,那捐献者当然可以首选这份脐血。

但目前的情况来看,捐献脐血的过程并不顺畅,存在很多问题。

大众健康:主要都有哪些问题呢?

邓钺:最主要的问题就是捐献者的盲目性。不花钱,对自己也没什么影响,那捐就捐吧。存在这样想法的人不在少数,其实他们并不明确捐献的意义在哪里。所以导致了很多在随访中找不到联络人或者采集后忽然拒捐,不愿意配合随访的情况。比如搬家了,手机换号了,不愿意把宝宝的健康情况告知我们的随访人员等等。

大众健康:这会导致什么后果?

邓钺:我们随访的内容会关系到这份脐血的有效保存和利用。如果我们不能联络到捐献者,那么这份采集到的脐血就只能作废了。我们曾经发生过患者配型终于配上了,却找不到捐献者的情况。我们的工作人员打了无数的电话,甚至找到当时生产的医院都未果。最后只能放弃这份脐血。这样的案例不只一例。

大众健康:真是太可惜了!您认为捐献的意义在哪里?

邓钺:储存脐带血,真的是一生只有一次的机会。这不像献血,血液会再生,可以重复捐献。脐带血只有在怀孕生产时才能采集得到,也不见得所有采集到的脐血都能通过我们的检测、制备,最终成为一份合格的脐带血造血干细胞而被保存下来。这份合格的脐带血,有可能挽救一个人的生命,有可能给予一个家庭莫大的希望,有可能推动我们治愈重大疾病前进的步伐。这是多么美好的事情!在我看来,成功进行捐献的妈妈本身就已经是崇高和伟大的了。捐献对母婴没有任何影响,如果不捐献不自存,那这份随着生命而来的希望之血也就只能消逝在这个世界上了。所以,如果大家没有条件和意愿进行自存,希望可以捐献出来。

大众健康:我记得央视曾公布过一些数据,说自存脐带血库的配型利用率很低,我印象中不到2%。而公用库的配型利用率是自存库的4~5倍,好像是8%以上。也就是说,公用库的配型利用率远远高于自存库。

刘开彦:这种情况很正常。因为公共库是面向公众开放的,谁都有权力合理的使用它。而自存库只能是自己或家人使用自己的。再加上公共库的存储量少于自存库,从每年的采集来看,70%是自存的,30%是捐献的,本身分母的基数不同,那肯定公共库的利用率要高于自存库。这是很正常的。

大众健康:刘主任您建议自存还是捐献呢?

刘开彦:鼓励捐献,自存一定要充分,知情、自愿。公众应根据自己实际情况和需要选择是否储存,是自存还是捐献。

脐血采集后的“生命”历程

大众健康: 我们的自存脐带血会存18年,18年能保证存放的质量吗?18年后,这份脐血中的造血干细胞还能保有多少活力?

刘开彦:国外已有报道,冻存23年的脐带血细胞依然保持良好的活性和植入能力。2013年,北京市脐血库将一份冻存长达14年的脐带血成功应用于临床,细胞复苏后的活性达到了96.14%。我们的技术是没有问题的,甚至说已经达到国际领先水平。2005年,我们通过了ISO9001国际质量管理体系认证。2013年,北京市脐血库获得了美国血库协会(American Association of Blood Banks ,简称AABB)认证,成为中国首家通过该认证的脐带血库。AABB颁布的脐带血库相关标准是世界上公认的主要标准,受到全球同行的广泛认可。全世界除美国脐血库遵循此标准外,欧洲、美洲、非洲、亚洲等众多国家和地区的脐血库均严格遵守该标准。北京市脐血库获得AABB认证,标志着中国脐血库已经与国际接轨,并获得了国际行业标杆的认同。这不但保障了脐带血临床应用的安全性,也对进一步规范与提高我国的行业标准起到积极作用。

nlc202309030641

邓钺:合格的脐带血造血干细胞会被存放在零下196摄氏度的液氮中。这个温度在医学上认为是生命静止的温度,可以长久地保持造血干细胞的活性。我们的每个液氮罐都有一根真空管路通往室外的大型液氮储备装置,可以随时补充罐中的液氮量,保持液氮液面高度。每个液氮罐都由电脑控制,数据会在监控部门的集中监控下,一旦条件改变,随时都会报警。我们的这套装备是从美国进口的,是目前国际上最先进的。通过了AABB的认证,意味着我们存储的每一份脐带血都拥有了“国际身份证”,无论在世界上哪一个国家都可以被认可。

大众健康:我想很多准妈妈都很好奇,自己的脐带血在采集完成后会被带到哪里?都要进行哪些步骤?最终会“住”在哪里?您能为我们的准妈妈们描述一下,以便有一个感性的认识吗?

邓钺:采集后的脐带血会在24小时内由专人取送至脐血库,工作人员会首先对脐血外观和相关资料的完整性进行检查,并对脐血体积进行评估。符合初筛条件的脐血会生成伴随其一生的条码编号,然后进入制备流程。制备的目的是去除脐带血中的红细胞和血浆,保留富含造血干细胞的有核细胞成分。整个制备过程在符合GMP要求的洁净实验室内完成,采用的是国际上最先进的全密闭的自动化处理系统,保证制备效果安全可靠。制备完毕的脐带血会进行程控降温,使之严格按照每分钟1℃的降温速率缓慢冷冻至零下90℃,然后再放入液氮储存。在脐带血冻存的同时,针对每一份脐血的一系列检测也随之展开。一方面是安全性的检测:为了最大限度的减少经血传播疾病的发生,我们除了对乙肝、丙肝、艾滋、巨细胞病毒、梅毒的抗原或抗体进行检测,同时采用灵敏度更高的全自动仪器对乙肝、丙肝和艾滋病毒的核酸进行检测;还有脐带血的细菌/霉菌检测,使用的也是血站专用的进口培养系统。另一方面是有效性检测:采用全自动血液分析仪检测脐带血有核细胞数量和分类,使用流式细胞仪检测脐带血中的造血干细胞数量和活性,通过14天的集落培养评估造血干细胞的增殖和分化能力;这些检测可保证每份脐带血中含有足量有效的细胞。还有HLA分型检测,可用于临床使用时的配型查询和脐带血的身份确认。

脐带血最终的“家”是美国进口的世界单体容积最大的MVE液氮罐,其具有良好的密封保温能力,可同时进行温度和液氮液面高度的监控,具有24小时报警功能,保证“家”的温度恒定在零下196℃。事实上,除了液氮罐的监控,每一份脐带血从采集开始即进入了我们的连续监控系统,从采集医院的暂存冰箱温度,到运输过程温度,再到制备实验室和检测实验室温湿度,均实现了连续监测与无缝对接,确保脐带血所处环境的适宜。

大众健康:这真是一个充满爱和希望的过程。感谢二位为我们的读者提供了这么多准确的数字、鲜活的案例,我想我们的准妈妈一定会通过二位的介绍对保存脐血有一个全新的认识。

资源保存 第11篇

网络信息资源储存发展的开端就在InternetArchive在1996年成立之期。随着科技的发展, 网络信息资源储存规模从最初的百万数据到现在的数十亿的URL采集, 规模越来越大, 公司的项目难度增多的同时, 投入的成本也在不断增多[1]。

从1996年到1999年间, 首先InternetArchive的成立, 然后欧美各国纷纷开始网络信息资源存储项目的实验。1997年北欧图书馆了开启了NWA项目, 该项目借鉴了Kulturarw3的Web信息资源采集项目的经验, 这个项目主要唉事故对用户在网络中保存以及访问内容的操作做相关的要求, 这种要求不仅有助于用户能够更方便的使用网络资源, 而且有助于国家管理。

网络资源保存技术的起步阶段遇到了很多问题, 人们在吸取其中的经验的同时, 也在不断提高信息存储技术。21世纪开始, 许多国家对本国的存储技术做了高的要求。以国家为单位进行相互合作, 技术的发展速度会大大加快, 此时网络资源也加大了其扩展速度。随着国际的许多机构对信息资源的关注越来越多, 网络资源存储技术得到更大的重视, 随之发展的越来越快。

2. 网络信息资源存储发展现状

2.1 网络信息资源存储国际现状

越来越多的国家和人力参与并投入到网络信息资源存储的活动中来。关于网络信息资源存储的项目也逐渐增多, 且呈稳定增长趋势。国际互联网保存联盟2003年成立的时候只有12个成员, 随着越来越多人员和项目的参与, 到2009年3月其成员由最初的12个发展到了38个, 而且分布世界各地。就38家成员关网络信息资源储存研究的形式来看:6家项目形式, 比例约占15%;7家实验形式, 比例约占18%;11加运作但仍处于实验阶段, 比例约占29%;5家完全投入应用, 比例约占15%;4家商业应用, 比例约占10%;5家其他形式, 比例约占13%。目前很多国家和区域已经建立战略合成关系投资网络信息资源保存体系。

随着网络资源的不断增多, 网络信息资源储存发展采集的方式也不断改进, 如今, 已从以往的一次采集转变为事务型采集、深层网采集即数据库采集、LazyPreser2vation即二次采集等多种方式。采集策略和方式也朝多元化发展。采集内容也覆盖了人类社会的方方面面。

网络信息资源存储的系统技术和标准框架已日趋成熟。网络信息资源存储的系统技术中主要包括存储、访问、摄取、索引与检索总共四大部分, 另外IIPC也围绕网络信息存储系统核心功能开发了相关工具, 确保了其工具的完整性。IIPC技术委员会下设的四个子委员会负责对WA的存储、访问、摄取、索引与检索加强了实践工作和了深入研究。除了这些工具之外, WA相关的标准规范也有不少的研究, 就当前网络信息资源储存发展标准规范来看, 主要有:获取阶段的存档资源标识、统一资源命名等数据唯一标识, 多任务并发管理协议 (HIP) 、蜘蛛协议;存储阶段的存档文件格式、Web存档文件格式, 保存元数据实施策略、元数据编码与传输标准等。另外, WA领域还非常注重协作共享, 其在系统开发初期对于系统互操作就非常重视, 在研究中, 通过建立开放的模块化系统框架, 开发进行功能模块化, 让网络信息资源系统实现了开发、协作、互操作等性能。同时, IIPC还提出了建立WA系统体系框架以及开发系列开源软件的策略。

当前网络信息资源保存发展使用的工具主要有两种, 一种是PANDAS, 二种是澳大利亚的PANDORA。其中澳大利亚PANDORA工具主要是通过数字化存档系统进行采集, 在网络系统资源发展过程中, 各国不断加强交流和合作, 逐渐构建了合作者分布式功能, 其中美国WebAtRisk项目工具是构建在Web基础上的, 具有分布式仓储、管理以及存储等工具;Heritrix、Nutch2WAX、WERA, 是有IIPC资助开发的系列软件;Wayback是目前WA领域使用率最高的访问工具;WCT是一种由NWA与IIPC合作开发的应用率较高的保存工具。

为了加强网络资源存储相关的法律体制, 国家都对此都相对了法律规定。但是, 都没有很明确的把资源真正进行法律管理。为了完善相关法律机制, 许多国家用了很多方式。但是由于WA项目的投资数额巨大, 其各方面成本和风险问题也收到各界认识的重视。因为, 网络信息资源储存发展过错中需要投入大量的资金, 而且日益上涨, 为了使WA项目能够获得稳定的资金, 许多国家已经将WA项目的资金纳入了国家图书馆的业务开支。

2.2 国内发展现状

我国WA的研究始于20世纪末, 在对WA的系统研究上主要集中在国家图书馆、科学院以及一些少数的信息资源单位, 国家科学图书馆一直以来关注数字资源长期保存的宏观支撑机制和问题框架的研究, 目前正在进行的国家社会科学基金项目“网络信息资源保存的理论与方法研究”, 对WA的理论、技术予以探索研究。国家图书馆和高校的一些研究人员对元数据方案、服务模式、WA面临的问题进行了探讨[3]。

国家图书馆“网络信息采集与保存”试验项目 (WICP) 采集保存了自2003年以来“.cn”域名下的网站和所有中文 (编码) 网站, 积累Web数据达150G;对政府网站、电子报刊、国学的Web资源进行镜像存档;选择了2008北京奥运、中国载人航天工程等专题进行专题存档, 并对专题存档的数据进行质量控制、数据挖掘。国家图书馆已经成为IIPC的成员, 并积极推动和促进Web资源呈缴法的起草, 以解决WA长远发展过程中的法律障碍。

当前, 我国诸多网络信息资源研究人员不断学习和研究, 期间积极参加各类交流会, 同时还成立国家文献中心、科学图书馆;承办了两次数字资源长期保存国际会议, 促进了国内外网络信息资源研究人员的合作学习, 在一定程度上推动了网络信息资源的发展。

3. 网络信息资源存储发展趋势

随着社会的不断进步, 网络信息存储的技术的发展趋势可以观察到有以下几点;

3.1 信息的内容越来越丰富

人们通过网络采集的资源涉及到生活的各个领域, 政治文化, 经济发展, 艺术生活等。然而, 资源采集的方式也在不断改变, 其信息内容也越来越丰富, 已经从静态网页逐步向动态网页转变了[4]。虽然也有将Web2.0软件形式纳入采集的意向, 但是由于各方面的问题和挑战, 最终没有得到解决和处理。

3.2 项目系统建设的标准化和开源化

当前, WA项目通过不断创新改进, 其标准进一步规范, 特别是IIPC在WARC标准上不断推广, 以及ARC向WARC进行转换时, 框架不断完善, 工具得到不断开发和创新。当前, WA项目项目中的访问工具、索引、采集等都是开源的, 同时, 随着科技的发展, 其性能、效率、规范化等还在不断更新[5]。

3.3 项目工作流程的规范化

随着技术的不断发展, 项目在不断朝着规范化的方向发展。国家也在许多方面对项目方面做了要求以及尝试.

由此可见:社会在不断进步, 网络资源技术也在不断发展。我们应该看清形势, 朝着正确的方向发展, 让资源存储技术有更大的飞跃, 这对我们的生活有很大的意义, 也对国家有不可替代的作用[7]。

摘要:作为现今全球最大的信息资源库。网络信息资源也越来越多, 然而随着社会的不断发展以及人们对网络信息的关注不断加深, 人们对信息的存储技术有了更大的关注。本文就网络信息资源保存发展现状及趋势展开分析和讨论。

关键词:网络信息资源,发展现状,趋势分析

参考文献

[1]吴巧玲;嵇山鹰.国外医药产业网络信息资源及其开发利用研究[J].《中国科技信息》, 2012 (10) :179-180.

[2]邢幸.网络信息资源检索途径与方法探析[J《]科技创新导报》, 2012 (08) :33-34.

[3]任旭.网络信息资源检索途径与方法探析[J].《科技信息》, 2012 (12) :248-249.

[4]刘兰, 吴振新, 向菁, 孙志茹.网络信息资源保存开源软件综述[J].现代图书情报技术, 2009 (5) :11-17.

[5]陈清文.网络信息资源保存研究综述[J].山东图书馆季刊, 2006 (1) :18-20.

[6]向菁;吴振新.网络信息资源保存发展现状及趋势分析[J].《中国图书馆学报》, 2009 (02) :24-41.

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

【资源保存】相关文章:

安全保存05-14

保存策略05-15

保存温度07-05

保存组织07-22

自动保存07-23

资料保存07-24

低温保存09-07

先行登记保存08-03

保存图片教案08-16

传承和保存论文05-25

上一篇:旅游常见病的防治方法下一篇:政务会议