作为我国乃至亚洲现存最古老的私家藏书楼、世界现存最古老的三大家族图书馆之一,宁波市天一阁博物院承载着四百余年的书香历史。如今,这座文化殿堂正面临一项跨越时代的挑战:如何让30万卷珍藏古籍在保持物理“不朽”的同时,也能实现数字“永生”?
近日,由宁波市天一阁博物院研发的“基于人工智能的古籍文献大数据治理平台”(以下简称“平台”)入选“世界互联网大会文化遗产数字化案例”并正式对外发布,这不仅是一次技术成果的展示,更致力于系统性地解决长期困扰全球古籍数字化领域的三大核心痛点——“流程散、效率低、利用浅”。
该平台融合尖端人工智能技术,目前已成功为总计360万页珍贵典籍注入“智慧生命”,使其真正“走出深闺”,面向公众。更重要的是,它构建了一套可复制、可推广的古籍“活态传承”智能新范式,为文化遗产的数字化?;び牖罨倭诵侣肪?。
沉睡的宝藏:古籍数字化面临的三重“枷锁”
古籍数字化领域普遍面临着三大结构性困境。这些困境如同沉重的“枷锁”,严重阻碍了文化遗产的数字化进程。
流程之“散”——割裂的“数据孤岛”:传统数字化工作流中,编目、扫描、影像管理等系统分散独立,信息共享不畅,跨系统流转甚至依赖人工操作,导致效率低下、成本剧增、管理难度大,且存在数据泄漏风险。
整理之“困”——高昂的“人工壁垒”:古籍文献特有的竖排文字、双行夹注、异体字、草书等复杂性,使传统OCR(光学字符识别)工具错误率极高。数字化成果极度依赖海量的人工校对,高昂的人工成本阻碍了绝大多数古籍的深度数字化。
知识之“浅”——沉没的“数据价值”:即便耗费巨资完成数字化,成果也多停留在“电子影像浏览”和“简单关键词检索”层面。古籍中蕴含的丰富信息(如人物、事件、地点)无法被有效关联和激活,学术研究难以深入,公众文化价值转化严重不足。
人机协同:一场贯穿全生命周期的业务革命
面对“三重枷锁”,宁波市天一阁博物院的应对策略并非单一的技术炫技,而是一场彻底的“业务革命”。平台构建了古籍数字化领域“首个全流程线上服务体系”,将传统的“手工作坊”升级为可管控、可追溯的“智能工厂”。该体系贯通了“古籍出库-任务分配-扫描存储-影像处理-质量检测-分级归档-内容提取-一键发布-共享检索”等古籍数字化的全生命周期环节,消除了多系统切换的损耗。
在这一“智能工厂”中,平台引入了“人机协同全流程管控”的核心模式。AI承担了高频度、长周期的重复性工作(如批量拼接、清晰文字提取等),而古籍专家得以从繁重的、低价值的“重复劳动”中解放,回归到最具创造性的“知识判断”工作(如疑难字标注、知识图谱审核等)。这种人机协同模式,既保障了基础性工作的效率与精准度,又使专家智慧聚焦于需要深度学术研究与文化洞察的核心环节,最终实现古籍?;ご印疤辶γ芗汀毕颉爸橇γ芗汀钡淖蜕丁?/p>
解码“智慧大脑”:自迭代的多模态AI“读懂”古籍
如果说“全周期服务体系”是平台的骨骼,那么其“人工智能技术支撑层”便是平台的核心——“智慧大脑”。
该“智慧大脑”是一个依托百万级古籍数据模型预训练的“多模态AI系统”,它模拟人类专家阅读古籍的过程,融合三大关键AI技术:
图像分割(“看”清边缘):精准提取古籍边缘,自动剔除扫描冗余;特征提?。ā翱础倍季郑褐С虐媸降淖允视κ侗?,能快速分辨竖排、夹注、图文混排等复杂版式;文字识别(“读”出文字):在理解布局的基础上,实现高精度的文字提取。
这套系统完美解决了行业两大难题:一是“智能拼接”,AI自动将扫描的“筒子页”(正反版面)精准拼接为完整的一页;二是“智能提取”,AI采取“先理解布局,再按布局去读”的策略,高效处理家谱、科举录、政书、地方志等不同类型的古籍。
更重要的是,这是一个“活”的AI系统。平台内置“增量训练??椤?,古籍专家在“人工复核”环节标注的“高价值疑难样本”,会随即进入AI的“增量训练”???。AI通过“模型优化”和“误差修正”实现“持续进化”,越用越“聪明”,越用越好用。
成效卓著:效率飞跃与价值激活“双实现”
革命性的业务流程与强大的AI大脑,共同催生了天一阁古籍数字化工作的“效率飞跃”与“价值激活”。
效率飞跃:从“四天一本”到“一天半一本”。宁波市天一阁博物院通过构建“全流程线上服务体系”,将单册古籍的数字化周期由4天缩短至1.5天,效率提升达62.5%。同时,依托“自迭代多模态AI引擎”,在版面识别、文字提取、筒子页拼接等关键环节上,自动化处理能力提升超过10倍,让古籍数字化真正进入“智能时代”。
价值激活:古籍“活”起来,让文化“动”起来。截至目前,平台已完成360万页古籍的数字化?;?,公众访问量累计达460万人次,用户遍及全国31个省区市。
在2025年“国际博物馆日”期间,宁波市天一阁博物院正式发布数字化成果,线上可查阅古籍总量突破2万册,开放规模居全国文博机构前列,推动珍贵古籍“从库房走向屏幕”,实现文化资源的全民共享。
创新引领:从“数据保护”到“知识生产”
宁波市天一阁博物院AI平台的最大亮点在于突破了传统数字化的边界。通过大语言模型与知识图谱技术,平台能够将古籍内容转化为“知识网络”,实现从“存档”到“生长”的跃迁。
例如,平台可自动生成“范钦生平知识图谱”,为研究者快速构建“知识年表”“时空地图”等数字人文工具,助力古籍研究进入智能时代。同时,项目还推出“轻量化部署方案”,让数字化经验可复制、可推广,为行业提供低成本、高效能的整体解决方案。
未来愿景:共建全民参与的“数字书房”
宁波市天一阁博物院表示,下一步将继续推进多模态AI技术的深化应用,攻克“草书、篆书”等复杂字体识别难题,并拓展至“家谱”“方志”等地方特色文献。
平台还计划推出公众参与式的古籍知识标注机制,构建“公众—专家—机器”协作的知识生产新模式,让更多人参与到古籍的?;び朐偕?。
从“藏书之阁”到“知识之源”,宁波市天一阁博物院正在以科技之力,让古籍在数字时代焕发新的生命与价值。
(作者单位:宁波市天一阁博物院)




