澳大利亚国家档案馆从数字文件到长期数字存储的转换步骤
澳大利亚国家档案馆接收的联邦政府部门的数字文档在经过一些处理步骤后,作为长期的数字存储项目保存在国家档案馆中。澳大利亚国家档案馆的“数字保存项目”(Digital Preservation Project)就负责完成这一任务,这个项目基于XML语言,它的总体目标是开发一种能够接收政府部门电子文档、能加以保存并确保日后利用的方法,既要保存原始格式的文件,还要保存已经转换成档案数据格式的文件。将政府的原始数字文件转换成长期存储的数字档案,可分为以下几个主要步骤:
1、转换准备:
政府部门的职员负责为国家档案馆准备原始的数字文件,另附上一份打印的文稿,送交有关部门检查,获批准后,这些文件将保存在光盘、DVD、数字磁带、硬盘等媒介上,一并移交给档案馆的数字转换工作人员。
2、“检疫”:
档案馆数字保存部门收到档案文件,须检测电子文档有无病毒,并检查是否所有被提议进行转换的文件均已齐全。检查过程在独立的电脑环境中进行,不与档案馆中任何计算机网络连结。隔离检测可确保文件在检查出现问题时不会威胁其他的数字档案。工作人员利用一种新的书写程序,将文档转移到新的载体上,以检测被转换的文件与要求转换的文件的一致性,同时检测病毒。如果文件未通过检测,原政府部门将被告知,须重新复制原始文档。不合格的移交档案或被销毁,或退回原部门。一旦第一阶段的检测通过了,这些文件将在一个安全的档案架上度过4周时间,一切存储条件均符合档案馆存储标准。存放4周后,再利用更先进的病毒测试软件对文档进行进一步病毒检测。文件通过所有测试后,将被转移至新的载体上并从检测室移交给保存室。
3、保存:
保存设施是将保存程序应用于档案并确保持其长期可利用的设备。像隔离检验设施一样,保存设施也是一个独立的环境,不与档案馆中任何其他的计算机网络连结。档案保存过程由一种叫作Xena的软件来完成,每份文档在新的存储媒介上被转换成一种“原始字符流”,即用原来的数据格式表现的原始文档。同时这些文件还被转换成一种档案数据格式,这一转换过程叫做“标准化”,转换成的文档叫“标准化版本”。如果由于条件和技术限制,某一文件不能被立即标准化,须保留其原始档案的信息并以“未标准化”字样备案。“原始字符流”和“标准化版本”都被转移至新的媒介并保存在数字存储库中。随着不断创新和获得新的转换工具,“未标准化”的文档最终将被“标准化”。
4、数字存储:
数字存储也是在一个单独的计算机系统中,长期存储着数字档案,这里的档案只能通过系统终端进行利用。空间上和网络上的隔离是澳大利亚国家档案馆存储数字档案的策略之一,主要是为了数字档案的安全,避免在未授权的情况下被人利用。存储人员将经过检测的“原始字符流”和“标准化版本”下载到数字存储系统中,多次备份后分开保存。