网页档案信息长时间保存的战略。从国内外网页档案长时间保存的项目来看,其多为公益性项目,同时大部分的项目都是在政府部门的支撑下由多个部门联合参加或许举行的,如国家档案馆、高校、网络中心或许信息中心、商业部门和公益性组织。
如澳大利亚的数字档案PANDORA项目和我国的“我国Web信息博物馆”项目,都是由图书馆、档案馆和高校联合参加的。根据网页搜集的动态变化性和多样性等特点,仅有档案馆或许图书馆独自承当这类大项目是不现实的,因而必须鼓舞多方力量一起参加到网页长时间保存中。
具体来说,便是要做好功能划分和利益分配的工作。首要,参加单位可以在法律答应的范围内对网页档案信息资源进行合理的使用,如图书馆和档案馆可以使用网页资源进行档案服务的深度开发与加工。
其次,网页档案搜集工作对技能的依赖性较高,因而还要支撑和鼓舞互联网企业或许信息技能企业参加到项目中,为搜集项目供给技能上的支撑。
最后,还要不断丰富搜集项目的资金来源,使用项目众筹和社会募捐等非政府拨款方法募集资金,为搜集项目供给更多的资金支撑。
当前网页档案信息的主要搜集战略有两种,分别是完全性搜集战略和部分性搜集战略。完全性搜集战略是指对网页的所有信息进行搜集。
现在,瑞典、奥地利和美国的多个网页档案保存项目采用了完全性搜集战略。完全性搜集战略的优势在于不需求人工对网页内容进行判别和仿制,而是完全由机器完成这一操作,因而其本钱较低。
关于小型的、资金较为缺乏的档案管理部门,可适当地挑选完全性搜集战略,但需求注意对信息进行过滤。内容结构和类型较为单一的网站可经过设置关键词对无用信息进行过滤,同时树立定期的人工审阅机制。
部分性搜集战略是指有挑选地对网页的某个类型或许学科的内容进行搜集,因而其内容的专业性较强,主题也十分鲜明。与完全性搜集战略不同的是,部分性搜集以价值判别为基础,经过拟定完善的搜集规范限制搜集的内容,因而规范是否合理就成为部分性搜集是否成功的决定性因素。
对此,档案管理部门在挑选部分性搜集战略时,应充分考虑到网页档案信息的动态变化性,对网页信息实行动态监控,并及时调整搜集战略,不断提高网页搜集的覆盖率。