古联公司以高品质古籍整理数字化加工为起点,逐步构建起古籍数字化良性发展生态圈,为“让古籍活起来传下去”的时代命题写下生动注脚。
拜访中华书局古联(北京)数字传媒科技有限公司(以下简称“古联公司”)的那天,正值立春。明亮的阳光漫过玻璃窗,洒满一室,古联公司的办公区一派生机。古联公司从只有七八个人的古籍资源开发部,到如今成长为拥有近百人的行业领军者,古联公司总经理洪涛见证了这一路的奋斗与蜕变。依托中华书局百年品牌及权威古籍整理成果,古联公司以高品质古籍整理数字化加工为起点,打造了涵盖110亿字的古籍大数据中心,逐步构建起一个包括数据库集群、众包整理平台、人才培养体系、技术输出服务等在内的古籍数字化良性发展生态圈,为“让古籍活起来传下去”的时代命题写下生动注脚。这10年,不仅是古籍数字化行业发展的缩影,更是传统文化在数字时代焕发新生的有力实践。在产业智能化浪潮汹涌澎湃的当下,古联公司不断创新,推动古籍整理出版进入人工智能时代。“以前我们侧重‘聚古’,把资源聚集起来,但公司的发展不止于此。基础设施建好了,我们就要继续往前走,让这条高速公路到达目的地。新的10年,我们的使命聚焦‘联今’,让中华优秀传统文化与现代社会生活深度融合,让古籍智慧在新时代焕发新的生机与活力。”洪涛感慨道。
在成立的第10个年头,古联公司乔迁新居。新气象,新征程,一个古籍整理出版的新纪元正在徐徐开启。
顺势而为,构建古籍生态服务体系
古联公司的成立,是顺势而为,也是大势所趋。
从2001年起,中华书局开启古籍数字化探索,但在此后十余年间处于犹豫观望状态。据洪涛回忆,当时社会上对古籍数字化的需求日益旺盛,然而盗版侵权事件频发,学界“共享经典古籍数字资源”的呼声越来越高。2013年,中华书局终于下定决心,启动《中华经典古籍库》项目,由古籍资源开发部的七八名员工牵头实施。随着项目推进,仅靠一个部门的力量已难以支撑规模化发展,成立独立公司的想法应运而生。2015年8月,古联公司正式成立,名字取“古籍联合”之意。作为从2001年就加入中华书局、全程参与古籍数字化工作的“老兵”,历史专业出身又读了计算机专业在职研究生的洪涛,担任古联公司常务副总经理。
古联公司刚成立时,仅有十多个人和《中华经典古籍库(第一期)》一个产品。据洪涛回忆,2018年是公司发展的关键一年,国家级古籍数字服务综合平台——籍合网上线。那时候也是重点产品《中华经典古籍库》新一期的攻坚阶段,为了赶在上线前完成海量数据处理工作,团队成员连续数月加班加点也毫无怨言。正是这样的坚守,让《中华经典古籍库》成为古联公司的基石产品。《中华经典古籍库》获第四届“中国出版政府奖”,该产品如今已更新至第十三期,成为学界不可或缺的研究工具。

之后,中国出版集团“中华国学资源总库”募投项目注资1亿元,有力推动了古联公司的内容资源扩充和平台建设,公司开始擘画一个更宏大的数据库产品蓝图。目前,籍合网已上线涵盖出土文献、传世文献等多种资源的专业古籍数据库30余个,形成了较为完整的古籍数字资源体系,这些数据库成为国家文化基础设施的重要组成部分。在古籍字库方面,补充了在古籍数字化中整理的数万个楷书字形,系统研制、整合了甲骨文、小篆、西夏文、金文、战国文字、悉昙体梵文等专业领域字库,为学术研究、出版提供系统、科学的数据支撑。“专业字库商业价值不算高,但学术价值重大,是传承文化的必需之举。”洪涛说。古联公司如今已建立了16万字的古籍数字出版专用字符集,为古籍深度研究提供了坚实支撑。
籍合网更重要的意义在于,它构建了一个完整的生态服务体系:不仅有面向用户的数据库产品,还有面向从业者的在线众包智能整理平台,以及“研学一体”的古籍人才培训平台——籍合学院,提供学习、训练、认证、实践一体化的古籍人才培训服务。该平台推动了古籍整理、出版的转型升级,加速了大型古籍整理项目的出版,为全国多家大型地方文库的数字化建设提供了技术支持。
为了完成《中华大藏经(汉文部分)·续编》(甲部)书稿近2亿字的编辑任务,中华书局在2018年3月初首次向社会发布招募审校者的启事,申请人数很快就超过了1000名。第一批通过资质审核的申请者有300多名,主要是文史哲专业的教师与学生、佛学院的僧侣和对古籍编校工作感兴趣的各行各业人士,他们都热爱传统文化,并具备一定的古籍整理知识。攻读古代文学专业的复旦大学中文系硕士研究生方思圆是其中一员,在最平顺的情况下,她一天能审校一两万字的书稿,但审校梵文文献《乌刍涩明王仪轨梵字》时,一篇3722字的书稿就花了4个多小时,稿酬只有18块钱。还有些爱好者不习惯线上工作,就把文献打印出来手工校对后再誊录到电脑上。他们做这份工作更多是出于学习和热爱,并不在乎经济上的回报。
2016年,《中华经典古籍库》微信版上线,这是一座面向个人用户的古籍图书馆。洪涛记得产品刚上线时,大概有50个购买者。洪涛和团队成员给他们一一打去电话,了解用户使用场景,交流过程中他们了解到,很多用户并非学者或相关专业人士,而是司机、公司会计等一般读者,购买产品纯属个人的兴趣爱好,其中部分人后来还参与过古联公司的在线古籍整理工作。“个人用户不是我们产品的主要目标用户,所以我们一直也没有投入太多的精力去开发这类产品,但是我始终坚持要保留一些通道去连接和服务个人用户,这体现了企业的社会责任感。”令洪涛欣慰的是,有些参与过众包整理或培训的学员,后来成了中华书局或古联公司的正式员工。目前,仍有5000余名工作者通过众包平台参与古籍整理工作。
资源聚合,形成产学融合生态圈
资源聚合是古联公司古籍数字化资源建设的核心。公司成立之初,内容局限于中华书局自身资源。为了打破瓶颈,团队提出了“古籍联合”的核心战略,一方面积极寻求兄弟出版社的合作,另一方面创新资源获取模式。
与凤凰出版社的合作堪称里程碑式的突破。作为国内古籍整理出版重镇,凤凰出版社有着丰富的内容资源。古联公司提出了“非独家授权、销售收入分成”的商业合作模式:凤凰出版社无须投入额外成本,只须授权,古联公司负责数字化加工和销售,年底按销售收入分成。这种开放的态度和双赢的合作模式得到了凤凰出版社的大力支持。如今,古联公司已聚合了32家兄弟出版社的古籍出版资源,得到了20多位作者的授权,上线古籍整理成果40亿字。
在过往的古籍整理出版模式中,古籍数字化出版往往滞后于纸书出版,古联公司则打破了这一现状。其与宋史方面的权威学者李伟国先生合作的《宋代墓志铭数据库》,实现了优先数字化整理出版的创新突破。这种模式不仅加快了古籍传播速度,也为科研成果提供了新的出版路径。该数据库自2018年上线以来,受到了学术界的广泛赞誉,并成功入选国家新闻出版署的出版融合发展工程项目。
古籍传承,关键在人。作为深耕校企合作的核心成员,古联公司总编辑朱翠萍带领团队,通过与多家出版单位、科研院所合作,不断扩大资源规模,形成了“校企联动、产学融合”的良性生态圈。
朱翠萍的专业是文字学,她笑称自己的专业就是研究“回字有几种写法”。2016年,博士后出站的她,放弃进入高校,选择加入古联公司。“当时洪涛老师面试,我第一句话就问:‘这家企业会破产吗?’”朱翠萍笑着回忆。对一个从未在企业工作过的学者来说,一切都是未知的,但最终她还是留下了。幸运的是,她发现这里做的事,是自己想做的。这些年,她推动了古联公司与清华大学、北京大学、北京师范大学、南京农业大学等数十所高校的合作,校企合作模式也在不断丰富:与北京大学合作编写教材《古籍文献数字化概论》、设立奖学金;与清华大学合作创办的《数字人文》学术辑刊,连续两届入选CSSCI来源集刊目录,同时还联合申报了第二批教育部哲学社会科学重点实验室;与中国人民大学古文字强基计划班构建实习基地;与北京师范大学合作研发自动标点系统、垂直领域模型;与中国历史文献研究会合作成立“数字文献分会”……朱翠萍还被南京师范大学、河北大学、湖北大学、中国政法大学等高校聘为硕士研究生实践导师,指导研究生开展实践研究。“我们不仅是合作伙伴,某种程度上也承担了一部分高校相关学科发展的咨询工作。”
数字人文专业发展联盟的成立,更是将校企合作推向了新高度。2025年1月,古联公司联动清华大学、北京大学、内蒙古师范大学等30余所高校,牵头成立联盟。“联盟为高校提供了交流平台,大家共享教学案例、探讨发展路径,古联则将数字化平台推荐给学校使用,实现共赢。”朱翠萍介绍,联盟通过辑刊、年会、培训等活动,持续推动数字人文教育创新发展。

2025年8月,古联数字人文实验室落地湖北大学,标志着实验室项目正式落地、服务学科发展。该实验室依托“古籍智能整理平台”整合OCR识别、标点、注释、翻译等功能,形成一站式工作流程,加速学科研究所需要的数据建设工作。
同时,作为首个利用在线智能整理平台与线下专家学者合作的大型古籍融合出版项目,《明代集部文献数据库(第一辑)》于2025年8月上线。该项目数据库与精编纸书同步启动,在平台支持下,一年即完成1.2亿字的古籍采集与校对工作,效率较传统模式提升数倍,开启了古籍整理出版的数字新时代。
在古联公司,像朱翠萍这样随着公司业务发展而不断成长的人还有很多,比如培训部主任杨光磊,原本做个人业务部的运营,当公司发现培训业务越来越重要时,她转型去做古籍专业的人才培养,如今已把这一块做成重要的业务板块。古联公司在新一代互联网环境下,依托专业、权威、丰富的优秀传统文化资源,持续与不同产业领域进行融合互动。
技术革新,让古籍“活”在当下
从建设16万字的古籍数字出版专用字库到制定推广行业广泛采用的古籍数字化标准体系,从在文本识别、自动标点、命名实体识别、繁简转换、引文核对、古文垂直大模型等技术领域取得重点突破到打造数字人,古联公司紧跟技术发展的浪潮,在为古籍传承赋能的同时,也为国家古籍数字化工程统筹规划与实施奠定了基础。
文本识别技术的突破是其技术革新之路的关键一跃。最初,古联公司的技术团队将古籍中的文字切成单字图片,由人工标注后再训练模型,再通过与高校开展产学研合作,发挥各自的优势,整合标准语料与模型,经过反复训练,最终实现了手写体图书95%、版刻本图书99%以上的识别准确率。“这极大地提升了数字化效率,降低了编校成本。”洪涛说。
文白翻译是另一个技术突破点。针对通用大模型文白古文专业知识翻译不准确的问题,古联公司利用中华书局的文白对照出版资源,将文言与白话逐一匹配,反复训练出了这一垂直领域的翻译模型,如今该翻译产品已经实现商业应用,并对外授权。
数字人的研发让古籍走进大众视野。2022年,古联公司成立数字产业部,专门做数字内容的转化和文化传播的落地。其打造的高清仿真数字人,与娱乐化数字人截然不同,兼具学术性与传播性。以苏东坡数字人为例,团队不仅提取了古代绘画中的苏东坡形象,梳理了文献中对其外貌、气质的描述,还邀请造型专家和文史专家召开评审会,反复打磨形象。“我们要做的不是简单的形象复刻,而是要让数字人具备苏东坡的性格与学识,可谓以文献校勘的方式完成人物形象设计。”洪涛介绍,团队为数字人构建了详细的知识图谱,涵盖其生平经历、作品思想、兴趣爱好等,使其能够与用户进行符合时代背景的对话,成为一个真正的“智能体”。目前,古联公司已完成苏东坡、李白、李清照等数字人智能体的开发,为大同打造的“花木兰”数字人和为广东省惠州市定制的“惠州东坡”数字人,成为城市文化传播的新名片。
“中华先贤智慧阅读空间”的诞生,则开创了空间出版的新形态。项目突破性地运用智能交互式投影技术与AIGC(人工智能生成内容)技术,彻底打破了古籍阅读的固有边界,带给孩子沉浸式学习的全新体验。对《天工开物》《本草纲目》的AI交互阅读空间的开发,已于2025年完成。项目成果在深圳文博会展出时,吸引了众多孩子和家长驻足,成为传统文化普及的新载体。

聚古联今——10年过去,古联公司的这一使命正被赋予新的内涵。站在10周年的节点上,洪涛表示,智能化将开启古籍整理出版的新纪元,古联公司的未来将聚焦三个方向:一是深化人工智能融合应用,二是拓展服务领域与场景,三是完善文化传承生态。
“古籍数字化是古籍整理的一种形式,最终目的是让现代人能读懂古籍、用好古籍。”在洪涛看来,在人工智能时代,“读懂”有了新的含义:不仅是逐字逐句地阅读,更是理解古籍中的内容,获取其中的知识,把这些知识和现代人的兴趣、需求连接起来。例如近期上线的《中华历代物产数据库》是古联公司与南京农业大学合作的项目,该项目将古代方志中的物产信息提取出来,通过人工智能获取互联网上的现代物产信息,将古今打通。“这也是我们第一次将古籍与现代的生产生活紧密结合。”洪涛说,这个数据库不仅可以助力中国古代农业文明探源,还能为文化旅游和地标产品开发赋能。“中华书局已经走过百余年,古联公司是书局发展历程中的必然产物。未来,古联公司将继续以技术为翼、以文化为根,让古籍中的智慧穿越时空,为现代人提供精神滋养,在传统文化创造性转化和创新性发展的道路上稳步前行。”洪涛说。

为文学、影视等领域开展传统文化内容再创造的个人或企业提供支持服务,是古联公司谋划的另一个发展方向。“我们可以帮助他们更快地开发出新的文化产品,促进传统文化的大众传播。”洪涛说:“这才是真正的‘联今’——把古代文化遗产和今天大众生活连接起来。”
采访结束时,记者体验了古联公司打造的“中华先贤智慧阅读空间”。投影墙上生动再现了《天工开物》里的农耕场景,用户可以通过图文、视频、游戏、交互等多种形式学习和体验古人如何为稻谷脱粒、如何舂米、如何织布;与英姿勃发的数字人苏东坡零距离对话,一起吟诗作对、笑谈古今……这一幕,或许正是古联公司“聚古联今”的最好注脚:让古籍“活”起来,让传统文化真正走进现代人的生活。■

