开展电子文件中心研究势在必行
在全国电子政务建设和政务公开政策的推动之下,一种新的电子文件管理模式——基于政务网的电子文件中心悄然兴起。2004年12月28日,江苏省常州市电子文件中心正式运行,首开国内电子文件中心之先河;其后20天,苏州“张家港市电子文件中心”开通,成为国内首家县级电子文件中心。①目前,更多的电子文件中心正在构建之中。《江苏省档案信息化建设规划纲要(2005-2010年)》就明确提出“2008-2010年,全省100%的国家综合档案馆全面建成与电子政务相配套的电子文件中心”的目标。这一新生事物在迅速“燎原”的同时留下了许多值得探讨的课题,开展电子文件中心研究已成当务之急。
一、电子文件中心研究的基础
美国是最早建立并研究电子文件中心的国家。1988年,美国国家档案和文件署建立了电子文件中心,收集当时的现行电子文件,并且对国家档案馆、联邦机构提供的电子档案进行管理。②韩国政府也于2004年6月份制订了《电子文件利用促进法》,要求不同部门根据具体情况设立“电子文件保管所”,以提高电子文件的安全性和可信度。
我国对电子文件管理的研究已有十多年,期间国家档案局颁布了相应的电子文件管理标准。但以电子文件中心的模式来管理电子文件则始于2004年底,目前还处于实践探索阶段,尚未上升到理论高度进行研究。电子文件中心的建立将以理论和实际相结合的方式来探讨电子文件的管理模式。从资料和实际调查中发现,尽管已有个别电子文件中心投入试运行,但国内检出的有关电子文件中心研究的论文仅有一篇,可以说,对电子文件中心的理论研究尚未起步。随着电子政务的不断深入,电子文件中心的管理模式将迅速铺展,对电子文件中心的理论研究理应成为电子政务和档案学研究的前沿热点。
二、开展电子文件中心研究的现实意义
电子文件中心研究具有非凡的现实意义,主要有以下几个方面:
1、推动我国电子政务的健康发展
在电子政务这个大环境下,如何收集整理政府及其职能部门在电子政务平台上形成的电子文件,建立一个相对稳定、覆盖面广的文件资料收集网络和运行机制,确保各单位形成的电子文件“随时形成、随时收集、随时发布”,将有保存价值的电子文件完整、安全、永久地保存下来,并提供利用,显得尤为重要。而电子文件中心就是一个可以实现这些功能的系统,它是电子政务系统的坚实后盾。
2、探索我国电子政务信息管理的统一平台
为了提高电子政务的质量和效率,应尽量整合各种政务信息,以更好地为政府部门和公众服务。对电子文件中心的研究,旨在探索我国电子政务信息管理的统一平台。
3、实现电子文件管理模式与国际接轨
在发达国家,电子文件中心已不是一个新生事物,其之所以存在并沿用至今,是有其合理性的。对电子文件中心的研究,便于吸取国外的经验,实现电子文件管理模式与国际接轨。
4、确立有效的电子文件管理机制
在以往对电子文件管理的研究中,对于归档前的电子文件,应归属电子文件形成部门、各政府机构的信息中心、档案部门这三者中的何者加以管理,没有定论。对电子文件中心的研究,可确立电子文件的管理机制,以此回答是否需要设置专门的电子文件管理机构,是集中还是分散保管电子文件,应当由谁来鉴定和发布电子文件等悬而未决的问题。
三、开展电子文件中心研究的理论价值
电子文件中心研究具有重要的学术价值,其理论意义如下:
1、完善我国的电子文件管理理论
电子文件中心研究是对电子文件管理更深入的探讨,在此基础上得到的理性认识,将充实完善我国的电子文件管理理论。
2、对电子文件中心的建立和推广具有理论指导意义
电子文件中心研究将归纳出电子文件中心建设行之有效的原则与方法,从而为更多的政府部门建立和使用电子文件中心提供理论依据。
3、丰富数字档案馆理论
归档后的电子文件是数字档案馆的重要信息资源,从资源整合的视角来看,电子文件中心将是数字档案馆重要的外围机构。我国目前对数字档案馆的研究正处于不断深入阶段,电子文件中心的研究,将进一步丰富数字档案馆理论。
四、电子文件中心研究的基本内容
电子文件中心研究将拓展应用研究的领域,其近期的主要研究任务如下:
1、界定电子文件中心的概念与功能
电子文件中心研究应首先探讨电子文件中心的含义及其定位。从我国电子政务发展的现状和电子文件管理的实际需要出发,界定电子文件中心的基本功能,明确电子文件中心的狭义和广义概念。
2、研究电子文件中心的管理机制
我国对电子文件管理机构的建制一直处于争论之中,争议的焦点为:是否需要设立专门的电子文件管理机构?如果不需设立专门机构,电子文件应由一个部门进行管理,还是由多个部门进行联合管理?如果由多个部门联合管理,则应由哪个部门对电子文件管理负责?电子文件中心的研究将涉及上述争议,并提出电子文件中心的管理机制。
3、研究电子文件中心建立的原则
虽然建立电子文件中心具有迫切性和必要性,但其投入较大,功能繁复,为保障其健康发展,必须研究并确立电子文件中心建立的基本原则。
4、研究电子文件中心的详细功能
收集和发布电子文件是电子文件中心的基本功能,为实现对电子文件的有效管理,电子文件中心应具有文件初审、用户管理等一系列十分具体的功能。对电子文件中心详尽的功能分析,是电子文件中心研究的一项重要任务。
5、研究电子文件中心的构成
电子文件中心是一个信息系统,由一定的硬件和软件构成。针对不同电子政务环境下电子文件管理的个别特征,研究电子文件中心的基本硬件配置和软件构成,是电子文件中心研究的基本内容。
6、研究电子文件中心接收的电子文件格式
由于电子文件形成的系统环境和信息形态不同,电子文件中心将接受多种文件格式。因此,研究电子文件中心可接受文件的格式类型,提出文件格式标准及文件格式转换途径和方法是电子文件中心研究的又一项重要任务。
7、研究电子文件中心对电子文件的管理
对电子文件进行管理、鉴定与开放的方式方法是电子文件中心研究的基本课题。
8、研究电子文件中心的安全保障体系
电子文件中心研究必然涉及安全保障问题,从用户管理、权限设置、多级存储体系、数据迁移等方面对电子文件中心的安全进行深入研究,探讨其安全保障体系是电子文件中心研究的题中应有之意。
9、研究电子文件中心与电子政务系统的集成
电子文件中心应该是一个相对独立的系统,但又是电子政务系统的一个重要组成部分,需要与电子政务的其他系统进行集成。集成并非简单的硬件联结和软件共享,而应是真正意义上的无缝集成。与电子政务系统的集成是电子文件中心研究的一项有深度的课题。
五、电子文件中心研究的核心课题
1、确立电子文件中心的管理机制
电子文件是否应由独立的管理机构管理,这是在电子文件中心研究过程中必须重点关注的问题。找到适合我国国情,又有利于有效管理电子文件的管理机制是电子文件中心研究的难点之一。
2、提出电子文件中心的参考模型
系统参考模型是指从技术和管理的角度对系统进行描述的一种模型,是整个信息系统开发的基础。电子文件中心参考模型的优劣直接关系到电子文件中心开发与管理的成效。目前一些专家或权威机构对电子政务系统、办公自动化系统、ERP系统等已经提出了相应的参考模型。电子文件中心参考模型的提出,具有创新性和复杂性,是电子文件中心研究的难点之一。
3、用XML技术实现电子文件中心与电子政务系统的数据交换
电子文件中心是电子政务的信息管理平台,所以必须能够与电子政务的其他信息系统实现数据交换。2002年1月,国家标准化管理委员会和国务院信息化工作办公室批准成立了电子政务标准总体组,其主要起草的标准为基于XML的数据交换标准。所以,在电子文件中心接收和发布数据时,也需使用XML技术。鉴于目前XML技术在电子政务中的应用处于研究和探索阶段,如何使用XML技术实现电子文件中心与电子政务系统的数据交换,也是电子政务研究的难点之一。
4、多媒体电子文件中心的构建
多媒体电子文件所具有的文件容量大、数据非结构化、文件格式多、具有时间和空间维、含义难用文字表达等特点,给多媒体电子文件中心的建立带来了挑战。电子文件中心研究需要探讨多媒体数据库的建立、基于内容的多媒体信息检索方案、流媒体技术在传输多媒体电子文件中的应用等难点问题。
5、用数据仓库和数据挖掘技术实现电子文件中心的辅助决策功能
电子政务中产生的电子文件是政府信息的核心源泉,这些信息又是政府的决策依据。所以,高级阶段的电子文件中心应该具有决策支持功能。而决策支持功能是建立在决策模型、数据分析、数据挖掘等技术基础之上的。电子文件中心如何利用数据仓库技术、数据挖掘技术等实现对政府的辅助决策是需要深入研究的课题。
注释:
①《常州、张家港电子文件中心开通运行》,
http://www.da.jd.cn/info.asp?id=12422
②刘家真:《美国国家档案馆的电子文件中心》,《档案管理》,1997年第4期
(作者单位:苏州大学档案学系)
元数据设计应用相关研究综述
□ 金更达 潘燕军 黄文峰
关于电子文件元数据的研究,目前在国际档案管理领域是最热门的课题之一。我国档案界关于元数据的研究始于本世纪初,2001年由国家档案局邱晓威研究员主持的“电子文件和电子档案的真实性、完整性保证及其法律地位的认定”国家社科项目的正式启动,标志着电子文件元数据研究开始成为我国档案及电子文件研究领域的最前沿课题。然而据文献统计,与国外相比我国档案界关于元数据的研究起步较晚,主要以论述元数据的意义、重要性、元数据层次划分,或介绍电子文件元数据发展与国外电子文件元数据等为主①②③④⑤⑥⑦。本文主要对与元数据设计与应用相关的文献进行了详细分析,并从元数据标准设计框架研究、元数据管理以及元数据相关技术与协议三个专题综述相关的主要观点和研究成果。
一、关于元数据标准设计框架
元数据设计框架,为设计定制管理某种特定资源所用的元数据标准提供了需要遵循的规则和方法,从而确保了元数据标准的科学性和有效性。据文献分析,有关元数据标准设计框架的研究,在我国主要以张晓林和肖珑的研究为代表。
(一)元数据开发应用框架
张晓林指出,元数据作为“关于数据的数据”,既为各种形态的数字化信息单元和资源集合提供规范、普遍的描述基准和方法,又为分布式和由多种数字化资源组成的信息体系提供整合的工具与纽带,并提出了元数据的开发应用框架⑧。如图1所示:
根据元数据开发应用框架,在元数据的开发应用中,首先要明确元数据的应用目的。张晓林根据对文献的分析,将元数据应用目的划分为四大类:(1)信息发现:帮助使用者检索和确认所需要的资源,如Dublin Core主要用于组织网络信息资源。(2)信息描述:用于对数据单元进行详细、全面的信息描述,如图书的MARC、档案的机读目录、地理空间信息(FGDC)等。(3)资源管理:支持资源的存储、使用管理,包括权限管理、使用管理等。(4)资源保护与长期保存:支持对资源的长期保存,除了对信息资源的描述与确认之外,往往还需要关于该资源的格式信息、制作信息、转换方式、技术环境等,以便于资源的利用。
(二)中文元数据标准框架
肖珑认为,针对各种信息资源分别制定适当的元数据标准,为它的管理、发现、定位、获取提供一种实际而简便的方法,是数字图书馆建设中首先要开展的工作。通过实践,他总结出一套规范与指导各种元数据标准设计制定的规则和方法——《中文元数据标准框架》,图2简要揭示了元数据标准框架、元数据标准、元数据间的关系与作用。
可以说《元数据标准框架》从更高层次规定了元数据的功能、数据结构、格式、设计方法、语义语法规则等多方面的内容。框架提出了元数据的设计原则和元数据的功能。其中设计原则有简单性与准确性原则、专用性与通用性原则、互操作性与易转换性原则、可扩展性原则、用户需求原则。元数据功能则包括描述、检索、选择、定位、管理、评估和交互等⑨。
(三)电子政务数据元设计规范
我国以ISO11179系列标准和GB/T18391为基础制定了电子政务数据元设计规范,主要阐述电子政务元数据的设计和管理方法论,规定了电子政务元数据的基本概念和结构、电子政务元数据的表示规范以及特定属性的设计规则和方法,并给出了电子政务元数据动态维护管理机制⑩。到目前为止,我国电子政务标准化总体框架已经建立,并确立了一部分国家标准{11},但尚未出台电子公文管理元数据标准。
二、对元数据的管理
(一)集成管理
集成是信息化需要解决的关键问题之一。我国档案学者何嘉荪教授认为:“集成管理与服务是消除信息孤岛、实现数据交换和共享的重要手段,同时也是实现电子文件管理的重要手段。就电子文件及其管理而言,集成可以分为三个层面,即系统集成、数据集成和服务集成。系统集成指的是形成、运行、管理、储存和输出电子文件的系统平台相互之间的集成;数据集成指的是电子文件包括元数据以及其他信息资源在内的集成。这两种集成综合起来又可以称为对电子文件的集成管理,是对多种系统平台以及产生于其中的电子文件——具有分布性、自治性和异构性的电子文件运动全过程施行的,足以保障电子文件真实性的、动态的、有效的和全方位的综合统一管理。集成服务则是在集成管理的基础上进行的,一是将所有的服务(包括服务内容、服务方式)集成在一起,通过一个具有交互功能的公共服务平台(或可称之为门户),为用户提供满意的、高效的服务;二是通过系统集成和数据集成,为用户提供一个统一的信息服务入口(如搜索引擎),来实现信息的检索、定位等功能。”{12}
何嘉荪教授由此认为,要实现电子文件的集成管理与集成服务,必须以元数据为最基本和最重要的工具,并在此基础上提出了“基于元数据的电子文件集成管理与服务模型”。
(二)集中与交换管理
黄蓟光、王申康认为,现有元数据管理主要有两种思路:第一,建立一个元数据访问和整个元数据生命周期管理的系统——元数据仓储(Meta Data Repository),它是元数据访问和聚集的平台,从而实现元数据的集成。第二,建立一种元数据交换的途径(我们认为可称之为协议),不同系统中的元数据均可以通过这个途径来互访,从而把分布、异构的系统集成在一起实现元数据管理的功能。黄蓟光、王申康通过比较研究后提出了元数据管理的另一种策略:通过建立元数据交换途径,使处于异构系统中的元数据可以用这种途径来完成交换管理,从而实现元数据的集成管理;这种元数据交换途径包括元数据桥和元数据交换标准{13}。
(三)分布式对象管理
杨晓春认为,在网络环境下,为更好地适应信息的分布性、自治性和异构性,动态管理分布式对象间的合作是分布式合作组织面临的挑战之一。并提出了分布式环境下的信息合作模型,设计了以区域为单位的分布式对象管理体系结构,以及相应的元数据管理{14}。
(四)元数据与数据集一体化管理
GIS领域是最早进行元数据及其应用研究的领域之一。美国联邦地理数据委员会(FGDC)制定了数字地理空间元数据标准(CSDGM)。近来,该元数据标准得到了不断的完善,加入了针对数据共享的内容描述,使得元数据的应用条件更加成熟{15},建立在元数据基础上的分布式数据管理模型也正在展开,并提出了给予空间元数据的网络数据管理模型{16}。然而,元数据管理和数据集管理各自独立,虽然两者存在对应关系,但两者之间缺乏直接联系,只是通过元数据中的位置信息或描述信息对数据集位置进行解释,将直接影响到元数据的应用效果。因此,保持元数据和数据集的同步性或一致性,是关系到数据真实性的关键问题,为此提出了“元数据与数据集一体化管理模型”{17}。所谓一体化并非指元数据与数据集捆绑在同一平台之下的意思,而是管理上的一体化。
(五)A-Core:管理元数据的元数据
A-Core是二十世纪九十年代末出现的术语,是关于内容元数据的元数据。这种元数据对于指明描述性元数据集的来源,提供关于内容元数据的管理信息是十分有用的,可以为元数据提供有关其完整性、所有者、作者等的有用信息。此外,还可与元数据管理过程联系起来提供详细完整的信息。A-Core元素集定义采用了ISO11179-3,元素集包含四个主要类目:(1)谁,什么,什么时候;(2)有效日期;(3)元数据地址;(4)权限所有{18}。
三、元数据相关技术及协议
(一)XML语言
XML在世界范围内受到广泛关注很大程度上是因为要解决电子商务技术的问题。XML并不仅仅指XML标记语言,它同时还包括很多相关的规范,比如文档格式化标准、文档显示模式定义、文档查询标准、文档解析标准和文档链接标准等等,而且基于XML这个低层的规范,还有很多高层的应用协议,比如开放贸易协议、SOAP、BizTalk等等。同时XML是未来的数据库技术,在应用与系统之间交换数据都将使用XML。{19}
(二)基于WEB的分散式检索协议
由于架构在WEB环境上的数字图书馆相关研究日新月异,因此针对WEB环境发展出来的分散式协议也越来越多,其中在档案信息集成管理与服务中最具应用价值的有Open Archives Initiative Protocolfor Metadata Harvesting、Simple Object Access Protocol及Open URL。
Open Archives Initiative Protocolfor MetadataHarvesting,简称OAI协定。此协定的制定目的是提供一个具有应用程式独立且可相互操作、能够提供和提升Web上多种从事文件内容出版发行的社群应用的框架(包括电子政务和档案信息管理)。其主要目标为:(1)简化文件内容有效的传播;(2)提升电子文件的存取;(3)扩展存取数字化资源种类的范围。{20}
Simple Object Access Protocol,简单对象访问协议,简称SOAP。SOAP协议的制定目标是在分散或分布式环境中实现信息交换,是一个基于XML的协议。目前,SOAP在实现“基于WEB无缝集成”目标中,已经发挥着十分重要的作用。{21}
Open URL是一种在WEB间传递信息的机制,应用于WEB上超链接的一种标准表述语法,根据一种已经定义好的标识(Tag),增进WEB超链接能力。Internet的出现使信息浩如烟海,人们在获取信息时需要透过层层网卡才可取得资料。而现在有了Open URL,只需要手指一点就可得到,无论信息存放在何处。事实上Open URL机制在“基于WEB的无缝集成”中扮演着越来越重要的作用。{22}
四、结束语
综上所述,网络环境下,元数据已经成为对信息资源的描述、发现、管理、互操作的主要手段。无论数字图书馆还是数字档案馆,元数据都是它们不可或缺的重要组成部分。2004年,国家社会科学基金重点项目《基于XML的电子文件元数据标准》通过立项,标志着我国电子文件元数据标准进入了实质性研究阶段。笔者认为,尽管电子文件元数据研究在档案和电子文件管理领域刚刚起步,然而,关于元数据的研究在其它领域已取得了较大的成果和丰富的实践经验,值得档案界在电子文件元数据标准的设计与应用过程中借鉴。
注释:
{1}唐小燕:《背景信息——电子文件管理不可或缺的元素》,《档案学研究》,2001,No.5
{2}《元数据:电子文件管理的关键所在》,《山西档案》 2000,No.4
{3}朱莉:《文件保管系统中的元数据》,《中国档案》,2001.12
{4}刘琼瑶:《国际档案界关于电子文件元数据之研究》,《四川档案》,2003,No.2
{5}刘越男:《电子文件管理元数据——从认识到应用》,《档案与建设》,2003,No.1
{6}徐维等:《元数据概念的产生、发展与成熟》,《中国档案》2003.8
{7}谭■培等,档案元数据在电子文件鉴定中的应用,《浙江档案》,2002.6
{8}张晓林:《元数据开发应用的标准化框架》,《现代图书情报技术》,2001,No.2
{9}肖珑等:《中文元数据标准框架及其应用》,《大学图书馆学报》,2001,No.5:29~35
{10}冯项云等:《国外常用元数据标准比较研究》,《大学图书馆学报》,2001,No.4:15~21
{11}电子政务元数据工作组:“电子政务数据元”工作组(EMS/WG5)电子政务数据元第一部分,#
{12}金更达、何嘉荪:《数字档案馆模式探讨——基于元数据的电子文件集成管理与服务研究之二》,《档案学通讯》(录用待发表)。
{13}黄蓟光、王申康:《元数据管理策略的比较研究》,《计算机应用》,2001,No.2:3~5
{14}杨晓春等:《公布式信息共享环境中的信息合作模式》,《东北大学学报》,2001,No.3:257~260
{15}1SO/TC211,MetaData Working Document:Geographiclnformation,2000.
{16}李琦、陈爱军、夏曙东:《WebGis中地理空间MetaData管理系统的研究与设计》,《中国图像图形学报》,2000,10(5):811-816
{17}赖志斌、程承旗:《元数据和数据集一体化管理模型及应用研究》,《测绘通报》,2001,No.5:9
{18}赵慧勤编译:《A-Core:关于内容元数据的元数据》,《图书情报工作》,2001,No.12
{19}(英)MarkBirbeck等著:《XML高级编程》,《机械工业出版杜》,2002年5月版。