新闻中心 / 新闻阅读

社长代言出版融合发展项目|籍合网:以数据库为核心 打造古籍数字化服务矩阵

发布时间:2023-10-17 13:53:52 来源: 作者:古联公司

编者按:为深入贯彻习近平总书记关于媒体融合发展的重要讲话精神和出版工作的重要论述,认真落实中共中央宣传部《关于推动出版深度融合发展的实施意见》,促进出版行业深度融合发展取得更多实效,中国新闻出版传媒集团推出“社长代言出版深度融合发展项目”系列融媒体报道,邀请出版单位负责人代言本单位代表性深度融合发展项目,展现出版单位在加强优质内容出版传播能力建设,推动出版深度融合发展过程中所取得的最新成果与经验。



代言词

“籍合网”是由中华书局打造的国家级古籍数字化整理与应用的综合服务平台,入选了2022年度数字出版优质平台遴选推荐计划,同时也是“十四五”重点出版物出版规划项目之一。


“籍合网”秉持着权威与创新并重的原则,面向社会提供古籍整理与出版的数字化全流程服务,主要业务模块包括专题数据库产品、在线众包整理平台、智能化辅助工具。自“籍合网”上线以来,发布数据库产品30余个,资源规模达到35亿字以上;其中,《中华经典古籍库》已经发布到第十期,共计22.5亿字,收录了20多家出版单位及机构的整理本古籍成果,上线整理本古籍6800余种,获得了第四届中国出版政府奖。在线众包整理平台汇聚了7000余名参与古籍整理工作的专业人员和爱好者,结合OCR、自动标点、繁简转换等古籍整理智能工具,为众多出版社、大学、图书馆、数字化机构提供了古籍整理及数字化服务,推动了古籍事业的发展。


“籍合网”以“产学研”相结合模式,将专业化的精品内容和智能化的技术手段接轨,驱动资源、技术、人才三聚合,着力推动产业的结构性升级,为古籍领域的融合出版与创新开辟了一条新的道路,打造出全新的线上中华书局,推动中华优秀传统文化的传播与发展。



“籍合网”:

以数据库为核心 打造古籍数字化服务矩阵


“籍合网”是中华书局打造的古籍整理出版资源平台,于2018年正式上线。该项目是首个国家级古籍数字化整理与应用的综合服务平台,入选了国家新闻出版署2022年度数字出版优质平台遴选推荐计划,是“十四五”重点出版物出版规划项目之一。平台秉持权威与创新并重原则,以“产学研”相结合模式,将专业化的精品内容和智能化的技术手段接轨,驱动资源、技术、人才聚合,着力推动产业的结构性升级,打造全新的线上“传统文化故乡,现代精神家园”。上线5年以来,“籍合网”形成了以数据库为核心的,整合在线编校、技术研发、人才培养、校企合作的产业服务矩阵。

640.png


目前,“籍合网”服务用户涵盖大学、图书馆、文博机构、文史研究单位、党政机关,正式用户共133家,试用用户616家,注册个人用户21万人。同时,北美、欧洲、东亚等40余家大学、图书馆在使用籍合网产品。



加强古籍数据库建设 资源规模超35亿字


自籍合网上线以来,发布数据库30余个,资源规模达到35亿字以上。其中《中华经典古籍库》已经发布到第十期,共22.5亿字,收入了20余家出版社和机构的古籍整理成果,上线整理本古籍6825种,获得了第四届中国出版政府奖。《中华经典古籍库》开发有镜像版、网络版、微信版,还有学习强国版,充分体现了新中国古籍整理和研究成果,是国内使用最广泛的古籍数据库之一。

640.png


同时,籍合网还构建了专题文献数据库,例如:石刻资源6万余篇,历代登科人物10万余条,木版年画18000余幅,书法作品10000余种,甲骨文卜辞143856条,其他专题性典籍资源3亿字。这些资源与《中华经典古籍库》一起构成了全国最大的整理本古籍资源数据库。此外,还发布有近代报刊文献资源7.4亿字,口述史视频1300分钟,档案60000余幅,为近现代史研究提供了有效支持。

在古籍资源建设的同时,籍合网建设了“中华书局宋体字库”,收录超过15万字符,用于解决古籍中各类生僻字的在线检索和显示问题。除了楷书汉字还包括甲骨文、金文、小篆、悉昙梵文等专门字体,超大字符集的建设构成了古籍数字化必备的基础设施。



探索古籍整理智能化 以标准规范古籍数字化


技术是提升古籍整理和数字化效率的关键。特别是最近3年,随着人工智能和深度学习技术的发展,大批量古籍文献自动化整理成为可能。因此,籍合网也着眼于解决古籍整理、编辑、出版的自动化问题,该项技术也是古籍整理关键技术。

640.png


目前,大数据中心存储有共计66249种、2229万页、62.5亿字粗数据,大多数为古籍,少量近代期刊和学术著作,3亿字经过人工标引。以此为基础,“籍合网”集成了一系列古籍智能处理工具,如古籍OCR系统、自动标点、繁简转换等,形成了古籍智能整理平台,在古籍数字化整理和编辑过程中发挥出巨大的能量。

为建设运营“籍合网”,中华书局古联公司建立了一整套古籍数字化规范,包括《数据加工流程总规范》《编辑器数据整理工作规范》《元数据规范》《图像采集规范》《文字采集规范》在内,共计26种。2020年10月,“古籍数字化标准体系建设”荣获中国质量协会颁发的质量技术奖二等奖。


这些标准已经成为多家出版社古籍数字化出版的应用标准,为后续国家古籍数字化工程开展统筹规划与资源整合提供重要参考。

强化古籍人才建设 线上汇集编校力量

2022年4月,中共中央办公厅、国务院办公厅印发《关于推进新时代古籍工作的意见》,提出要“强化人才队伍建设”。多年来,籍合网通过建设古籍整理众包平台、“i编纂”小程序、籍合学院等积极加强古籍人才聚集、培养和建设,取得了一定的成效。


为解决古籍数据编校工作量大、专业化程度高的问题,籍合网平台建立了全国第一个古籍整理众包平台和“i编纂”小程序。自2018年上线服务以来,积累了近7000人在线古籍编校队伍,发布任务42976个,处理14.84亿字,为多个大型古籍整理出版项目、古籍数字化的项目提供编校力量,加速项目进展。

同时,为在线平台开展古籍整理和编辑人才的培养,籍合网推出了古籍整理培训平台——籍合学院,这是目前市场上唯一一个专注于古籍整理人才在线培训的项目,为古籍整理和出版机构提供知识共享和人才培养解决方案。

640.png

籍合学院课程内容涉及古籍整理及出版经典案例分析、古籍整理及出版专项技能培训、古籍整理及出版专题知识学习、基础理论通识课等。同时籍合学院还建设了海量的古籍整理及古文献学基础知识题库,为学员提供在线测评服务和能力模型分析。在籍合网,可以实现学习、训练、认证、实践一体化的古籍整理体验。



“籍合网”的多维度服务方式,已经成为了业绩标杆甚至是研究对象,建立了自己的学术地位和品牌。围绕“籍合网”形成的一系列标准成为古籍数字出版行业普遍应用标准,已经投入到上海、南京、福建、宁波等多地的数字化建设中。



640.png