一、档案数字化概述
档案是人类活动的真实记录,是人们认识和把握客观规律的重要依据。借助档案,我们能够更好地了解过去、把握现在、预见未来。档案事业是党和国家事业发展的一个不可缺少的方面,是一项崇高的事业。
档案是一项记录历史、传承文明、积累知识和经验的事业,涉及各个领域和行业,是各项建设事业发展的重要基础之一。
随着大数据时代的来临,大数据拥有者将大放异彩。
处在大数据时代的档案事业,将朝社会化、多元化、开放性和先进性发展,帮助人们洞察大数据带来的大价值。档案大数据,其特点表现在一方面可以提供政府企业运行的依据,支持核心生产力与应用,另一方面档案仍对合规、电子取证、安全、诊断以及其他支持性应用程序有相当大的价值。将成为政府、企业集团、机关事业单位、学校、金融等行业的无形资产。
中博奥长期从事档案数字化工作,目前,已经拥有一批专门的档案整理人员,都经过了专业档案管理者的细致培训,也在实践中得到过充分锻炼,文化水平较高,思路清晰,逻辑性强,有一定的提炼和总结能力;完全能达到档案数字化工作安全性、完整性、正确性、复杂性、权威性的要求。
二、档案数字化内容
所谓档案数字化、信息化就是利用计算机扫描技术,采用专业的扫描仪、高拍仪和数码相机等数码设备对纸质档案进行数字化加工,将纸质、缩微胶片、底片等载体上的档案信息作数字化处理,生成数字影像文件进行存贮,并将档案检索信息输入计算机,采用计算机档案管理系统进行管理和开发利用。
档案数字化的主要内容:
第一是档案目录信息的数字化,建立档案目录数据库;
第二是各种载体档案的数字化,如纸质档案、档案缩微品、照片档案及录音录像档案等的数字化,建立档案图像数据库或多媒体数据库;
第三是各类档案专题信息的采集与建库。
目前,档案室保存的档案信息形态主要以纸质、缩微胶片和底片等载体形式存在,只适应于传统的管理与传播方式,即实施手工管理和以点到点的传播,即便是经过编研等初步加工,编辑印发档案资料,实现以点到面的传播,其覆盖面也还是太小,很难达到社会化程度。档案信息资源的经济价值和社会价值也难以充分实现,更难适应当代“数字化生存”的形势。
档案数字化以后,对档案的现代化管理、使用和传播等都具有很重要的作用。
首先,档案数字化能有效地保护档案原件。
1.代替原件使用,把原件妥善地保存起来,便可以有效地延长原件的保存时间。
2.数字化副本分地保存。对那些需要长期或永久保存的重要档案,可以用数据备份的方法制成多份数字化副本的备份分地保存。
3.恢复档案材料模糊褪变的字迹。有些档案材料由于纸张、字迹和保管条件等因素,字迹出现了模糊扩散或褪变。这种档案可以经过计算机扫描技术生成数字影像,再利用计算机图像处理技术就可以恢复模糊褪变字迹,其次,档案数字化能改善档案的利用方式。
档案的数字化副本以其积极的、动态的特性改变了长久以来的档案利用方式
1.不再受“孤本”的限制。
2.异地调阅,数字影像文件可以通过计算机局域网或者广域网进行异地传输,使异地调阅利用成为可能。扩大了档案的利用空间,让更多的人们来了解档案,利用档案。
3.“时间”不再是限制,利用者可以随时使用自己需要的文件。数字化以后,将已开放的档案上网,这样所有利用者就可以在任何时间上网利用档案信息资源。
二、档案数字化流程及细节
1.资料移交
首先要将资料从档案室移交到加工现场的临时库房。在转移之前,双方共同在资料室完成资料的逐册清点工作,并登记承接时间、总册数,并有双方负责人在清单上签字。清点交接工作必须认真仔细,逐笔核对,不允许出现任何差错。这些信息作为资料归还时检查的参考依据。本步骤完成后,将会形成《移交清单》。
2.资料拆分
资料的整理和拆分时,资料拆分人员按照《资料拆分工作说明书》的要求进行资料拆分工作,并填写移交清单(此移交清单是资料拆分人员和项目经理共同填写)签字后领取并进行资料拆分。
3.资料扫描
原件的扫描与存储格式完全按照国家档案管理的统一标准要求扫描。资料扫描设置专业岗位和补扫岗位;补扫岗位主要负责改正图像质检发现的问题。
通过扫描,纸质资料数字化为电子资料。本步骤是资料数字化的核心和基础,直接影响对于纸质资料获取数字化信息的好坏。
扫描过程对扫描后的文件质量影响主要参数是:扫描分辨率(DPI)、色彩(黑白、灰度、彩色)、存储格式(JPG、TIFF、PDF)、明暗度和对比度。
按照技术指标,扫描时应根据资料纸张的质地,底色,薄厚程度,可拆或不可拆制定扫描方案,确保在扫描图像质量清晰的情况下,使原件完好无损。
4.图像处理
扫描后的原始图像需要进行优化处理,使得成品图像清晰、端正。根据扫描后的具体情况,图像要进行如下处理:图像旋转、校正还原,以符合阅读习惯;图像去原始信息外脏点、斑点去除,如去黑点、黑线、黑框、黑边等。处理过程中应遵循保持原貌的原则。
5.插图页面处理
资料中有插图的要在扫描时对扫描阀值做相应调整,如黑插图用灰度扫描不清楚时,应该用其他色彩扫描,在保持原始页面信息的同时使图像清晰可辩。
6.图像质检
图像质检设置岗位由项目经理兼任,负责每天抽检比例不低于图像处理总量的10%;
图像质检也是对扫描工序的第二次校验(二校),主要对两方面的情况进行检查:
图像数量:对处理的图像数量是否同原书数量一致、图像是否存在重扫、漏扫的情况。
图像质量:对图像是否清晰、可阅读,是否字迹断连、字迹过深,是否达到扫描要求的分辨率。
对文本域录入与文本录入域的标引、文件的页号及页数进行对比,对扫描前的图像页的标引与扫描后的图像页的编号与页数进行对比,发现不合格的登记清单并退回上一流程重新处理。
7.资料装订还原
资料图像成品检查合格后,移交客户前需要装订还原,根据原稿拆分时的情况按照骑马钉、斜钉、书式塑料装订等方式装订还原。
8.图像与索引挂接
文本域录入和扫描处理检验后的图像成品,按年度进行文字图像与系统的挂接,不需手工挂接即可实现文本与图像页与系统的挂接。挂接到档案管理系统中后,进行再次的成品验收,对各种使用习惯逐页进行检验,验收合格后移交验收小组验收。
8.数据移交
通过网络传输或硬盘方式移交成品数据。成品数据包括:单层PDF文件、TIFF图像、《备注说明》(原书出现残缺、重页、水淹、火烧、图像不清、空白页、插页、插图,提交数据的总数与原书的总数不一致等情况)文档。
9.档案数字化加工流程
资料交接(填写移交清单双方签字)和查重(重复资料的审核,客户确认后剔除)→→资料拆卷(起钉、书式塑料金属装订物剔除),检查纸张情况及内容书写清晰度→→资料分页扫描(按厚薄、颜色、阀值调整扫描参数)→→图像修图(纠偏、校正、清晰度调整、裁边)→→图像质检及无损压缩(多页TIF或PDF成品压缩)→→图像命名(PDF命名格式、命名字段规则)→→资料装订还原(骑马钉、斜钉、书式塑料装订、书式金属圈装订等)→→图像与索引挂接→→资料移交(按移交表清点无误后双方签字确认装箱)→→数据备份(硬盘或服务器双备份)→→成品验收(按批次打印加工台账清单,移交目录造册;客户验收通过签订验收合格书)