记录中国 > 现代化进行式 > 正文

张雷:用信息化“工匠精神”赋能数智时代档案治理

近30年来,信息化的飞速发展给人们的生产生活带来了巨大变迁。作为社会管理和文化传承的重要组成部分,档案治理在大数据背景下也实现了从纸质到电子、从封闭到开放的历史性跨越,在帮助社保、公积金、医疗、民政、教育、交通等中国政务民生领域实现普惠化、便利化的同时,档案的数字化转型也显著提升了档案的管理效率与信息利用价值。2007年成立于杭州余杭区的杭州易康信科技有限公司是一家专注于提供多模态数据档案化治理解决方案的企业,在创立者张雷的带领下,易康信已经成为了该细分领域的佼佼者,为数智时代的档案治理开好局谋好篇。

定位多模态数据档案化治理

档案从早期的石刻、竹简,到现代的电子文档、数据库,其形式与管理方式一直随着技术的进步而演变。传统模式下,档案管理依赖于手工操作、物理存储,工作效率低且档案易受损。而随着信息化、数字化时代的来临,档案先后经历了计算机技术辅助管理以及借助Office软件系统和办公自动化技术生成的大量电子文件,进入21世纪档案信息化管理更加规范化、标准化,如今,随着云计算、大数据、人工智能等新一代信息技术的出现,越来越多的政府机关、企事业单位以及学校等开始重视档案信息化建设,将其纳入信息化战略的重要组成部分,推动了档案管理事业的现代化进程。

1994年毕业于计算机辅助管理专业的张雷,正逢中国互联网开端之年,毕业后从事信息化相关工作,先后任职于证券公司、信息技术公司,在这个过程中积累了大量信息化实战经验。2007年,在信息化领域锤炼打磨了十几年的张雷创建了杭州易康信科技有限公司,致力于服务数字化改革,推进数字政府建设、保护数据资产安全等业务。

起初,易康信只是一家软件集成供应商,虽然也是以技术为核心优势,但集成的软件产品都不是自主研发的,而是以代理模式与其他软件开放商合作。随着业务的深入推进,张雷注意到,数据量的爆发式增长和数据类型的多样化,正让档案管理迎来前所未有的发展机遇。然而,不同地区、不同部门之间的档案管理系统往往存在差异,缺乏统一的技术标准和规范,存在信息孤岛现象,难以实现信息的共享和互通。如何实现这些数据的标准化处理,确保不同系统间的互操作性,是档案管理面临的重要课题。正是看到了档案管理的挑战与机遇,张雷于2017年做出了一个重要的决定,全身心致力于多模态数据档案化治理这一细分领域,研发拥有自主知识产权的产品,打造属于企业的核心竞争力。

18载风雨兼程,在他的带领下,现如今的易康信已经从一家软件集成运维企业成长为了一家拥有独立自主开发能力、并拥有数十项软件著作权和多项软件发明专利的深深植根于多模态数据档案化治理的专业化企业,并且在政务业务类办事应用系统原生数据在线归档方面进行的应用场景探索,也已取得了突破性的治理成效。

破冰结构化数据归档

随着数字化理念的不断渗透,政府业务办理的形态也在逐渐发生变化,原来很多业务需要去窗口提交资料才能办理,而现在几乎被掌上办、网上办的形式而替代。这个过程会产生大量的原生业务数据,其中包括大量以二维表结构进行逻辑表达的结构化数据。这些数据记录了政务实践活动的过程和结果,不仅有助于支持管理决策和优化政务服务流程,还具有凭证和查考价值,是国家档案信息资源的重要构成部分。《“十四五”全国档案事业发展规划》提出,加快档案资源数字转型,逐步建立以档案数字资源为主导的档案资源体系,为此要加大在结构化数据归档等技术方面的攻关力度,力争实现突破。

数据在未固化成档案之前,是可以进行流通的,但问题在于,数据的可变性太大,而且数据最大的弱点就是容易被篡改,容易丢失。为了避免这些问题,必须进行数据档案化治理,通过档案部门来证实数据的权威性。而现实存在的问题是:结构化数据独立存续难,数据与档案管理话语体系、结构体系不一致,不同历史时期积存的数据对原生业务系统的依赖性强;在采集、交换、处理、保存、迁移、利用数据的过程中,数据本体易改易失,可信赖的存证验证技术应用缺失,全生命周期管理无法溯源,影响档案数据的权威性;结构化数据归档标准确立难,业务档案数据专业标准建设未引起高度重视。

为了解决这些问题,易康信于2017年创新性地针对政务业务推出了信息系统开发平台OEA,并在之后的几年中不断更新迭代,先后衍生出了政链通电子数据存证管理系统、政务业务数据长久保存应用系统、公积金区块链存证验证平台、公积金业务归档管理平台等多个系统和平台,覆盖了从政府业务部门到档案室再到档案馆馆藏的全流程数据档案化治理方案。易康信这些自主研发的产品将海量的政务业务系统结构化及非结构化数据,转化为可以利用的通用数据资产,从数据核心价值出发,对原生业务系统进行连续性的归档,通过长期积累使数据持续发挥其社会价值,为政务业务系统形成闭环。

张雷介绍说,其中政链通电子数据存证管理系统就是OEA平台一个比较有代表性的组件,是OEA平台的底层支撑技术,是易康信于2020年推出的区块链技术。“区块链技术一定要放在应用场景里,才能发挥本身的作用和价值。”区块链技术在数据采集中的合理运用可以确保原生数据的完整性、真实性和隐私性,提高数据的可信度和可验证性。易康信的区块链存证技术贯穿采集、预归档处理、校验整理、入仓、移交、接收、馆藏的全流程,探索了区块链技术对业务系统原生数据档案真实性保障和溯源验证的有效方式,完成了区块链技术跨部门组网和对原生数据档案存证验真的落地应用。

张雷的另一个得意之作,也是OEA的衍生产品,即2023年针对嘉兴人力资源和社会保障局的需求研发的重要数据抢救性归档系统。人社是特别特殊的一个业务,全省从县一级开始到市一级的人社,由于技术及历史原因,各地政策又不同,使得很多特殊人群的原生数据没办法进入“国统”或者“省统”范围,面临着遗失和残缺的风险,形成了数据“孤本”。“嘉兴人社十年间迭代了两套系统,而且开发商都已经找不到了,系统维护成本高,需要关停。这就需要我们把这些特殊数据进行档案化治理,让系统关停后,这些数据还能够继续查询。”为了妥善处理退役数据,嘉兴人社与易康信共同搭建信息开发平台,用档案标准格式对数据进行打包封装,实现了多元汇聚、长期保存、有效利用,推动了退役原生数据早日纳入国家档案资源管理范畴,最终实现数据贯通,形成业务闭环。

建立标准,复制成功

凭借着过硬的技术和产品,现如今的易康信已经与嘉兴住房公积金、嘉兴医疗保障公共事务信息系统、桐乡人力资源和社会保障金信息体系等政府关键部门数据管理部门建立了牢固的合作关系。“与政府业务部门合作最大的难点其实在于如何调动他们的积极性。”张雷回忆说道,“如果通过我们的解决方案可以帮助政府业务部门节约成本、提高工作效率,当然也是他们喜闻乐见的。如果能再进一步帮助他们建立工作的标准化流程,那成功合作就是必然的。”

以嘉兴档案馆为例,2021年嘉兴档案馆在民政、住建、公积金三个部门试点开展原生数据归档管理工作。全部是多模态数据,不仅仅是结构化数据,易康信采用了进行归档的一个组件(多模态数据档案化系统),最后让数据瞬时调取、文件可视展现、关系型数据档案一表通览、追根溯源一键验证成为可能。“该项目于2023年验收完成,专家组对我们这一做法非常认可,认为具有很大的推广价值。这对于易康信来说是一项具有里程碑式意义的工作,在这个课题里,我们建立了四个标准,包括思维导图,清晰描述了从业务部门怎么进行归档开始,到怎么向档案室移交,再到档案室进国家档案馆馆藏的整个流程,这是一个标准化的流程,是放之四海而皆准的。”张雷自豪地表示。截至目前,嘉兴市公积金中心、市民政局等部门利用这一方式,共产生7400多万条结构化数据档案,移交进馆678万条,国家档案馆接管结构化业务数据678万条办件84万余件。因为免去了大量纸质档案的扫描和存放,成本也节约了50%左右。

用数据价值巩固历史的厚度,是易康信正在做也会持续坚持的一项工作,因为这项工作不仅推动了档案部门的数字化变革进程,对国家数字档案资源的增长也大有裨益,是一项利国利民的事业。正如张雷说的那样,数字化转型是中国式现代化建设的重要引擎,政产学研各方需要通力合作,形成彼此助力、相得益彰的良性发展态势,就一定能为档案强国建设注人强大活力。(供稿人:乔宇)