在2021年启动的嘉靖《宣府镇志》整理点校工程中,面对多个藏本的情况,如何选定最优版本成为了首要难题。为了解决这个难题,我从技术手段入手,用几个月的时间探索出“古籍数字合成对校法”,挑选出了最优版本,从而将版本选择问题解决。这个方法在图像修复、版本优化中有广泛应用,可以为全国古籍整理提供全新的思路。

对校法的现代化创新

校勘四法”由陈垣在1931年的《元典章校补释例》提出,首次阐述了对校法、本校法、他校法、理校法四种校勘法。陈垣将传统校勘经验上升为系统方法论,奠定了现代校勘学的基础。胡适评价陈垣让中国校勘学“第一次走上科学的道路”,黄永年评价陈垣“前无古人,后无来者”。

陈垣强调“凡校一书,必先用对校法”。对校法位于“校勘四法”之首,是最基础且应用最广泛的校勘方法。对校法要求他本与底本逐字对读,然后标注差异处,“校异同,不校是非”,避免主观臆改,为后续校勘提供原始依据。但是,这个方法严重依赖底本的清晰度,若底本脱漏严重、印刷不清,盲目照录将会增大巨大工作量,甚至会放大错误。

本文介绍的“古籍数字合成对校法”,遵循对校法原理,将底本与他本放到一起整合成混合本,如同将两张同等大小的幻灯片在灯光下对照,既能忠实反映各版本原貌,又能为后续校勘提供原始依据。本方法既能增加图像清晰度,又能比较各个刻本的差异,还能通过细微的断板差异判断印本的先后顺序。其本质是通过文本互校来揭示异同,因此该方法属于对校法。该方法理论可靠,实践效率质量均突破传统的二人对校法。

本方法有具体的适用范围:

第一,要求版本均为刻本。因手写本无法保证细节完全一致,因此,首要条件是“刻本”。刻本的具体形式可以是木刻本、石刻本、活字本等。如果翻刻本与原刻本非常相似,也可以尝试使用本方法,但处理难度会增加。

第二,要求扫描成影像格式,并保证影像平整。拍照会造成透视变形,且在书缝处会有严重阴影,因此不能使用拍照影像。他本与底本的影像差异度不能超过40%,差异过大将导致叠合失败。

第三,要求熟练使用PhotoShop“自动对齐图层”功能。本图像处理方法需要多次切换图层混合模式,多次裁剪,以及多次使用“自动对齐图层”功能。“自动对齐图层”是“古籍数字合成对校法”的关键步骤,它基于计算机视觉中的特征点匹配算法,分析图像特征边缘进行特征匹配,透视变换使图层大小趋于一致,最后采用多频段混合减少接缝。我使用的是PhotoShop 2018,已经满足图像处理速度,合成两张图片仅仅需要数秒。更新的2024版本加入了AI对齐,支持曲面变形,支持低光照和动态场景对齐,因此能够更精准地将图像合成。

陈垣在对校法中对底本的要求非常严格,底本必须是祖本。而在本方法中,由于影像可以随意切换叠放顺序,对底本的要求并不严苛,非祖本同样可以作为底本。因此只要获得两部以上馆藏的影像,无需深究哪部是祖本,只要底本的清晰度满足全通读,就可以展开整理点校工程。而祖本的鉴定无需专门研究,在对比过程中比较断板程度就能确定,可以节约大量的时间。

“古籍数字合成对校法”应该采取较清晰的影像作为底本,但是不同的组合次序会产生不同的效果,因此,选用底本时应先进行对照试验,然后决定底本。

以嘉靖《宣府镇志》为例,成文版作为底本时,因为成文版很好的版面完整性,所以能避免丢页漏页,但底本的清晰度并不能迅速通读。采用哈佛版作为底本时,能够迅速找出哈佛版的剜刻忌讳字,但丢页的情况就会多次出现。

高彩蛟:“古籍数字合成对校法”的应用举例

合成举例一(以成文版为底本,哈佛版为对校本)

底本影像选择成文版,对校本选择哈佛版。成文版作为底本,优势是版面完整,可以清晰看到整个版框、版心、页码完整,可以迅速判断是否缺页。

将两个版本合成后,底本中大量文字变得清晰,文字可以轻松识读,省去了传统对校法反复校的繁琐工序。

合成举例二(以哈佛版为底本,成文版为对校本)

第二例,底本选择哈佛版,对校本选成文版,即将第一例的版本进行了互换。哈佛版作为底本,优势是高清原彩,能够非常快地找出文中缺字,甚至能够从缺字推断出哈佛版的刊刻年代。

第二例经过处理后,能够迅速显示哈佛版中剜刻的文字。国家图书馆研究员刘波作所著《哈佛燕京图书馆藏稀见方志丛刊》明确提出,书中“虏”“夷”“匈奴”“狄”“戎”“达贼”“胡”“皇”字被挖掉。此类篡改痕迹虽然对后世整理造成了困难,但为判定重刻年代提供了重要依据。

“清之避讳,自康熙帝之汉名玄烨始,康熙以前不避也。”康熙二年五月结案的“明史案”,由于鳌拜主导严酷定性,最终被判处死刑七十二人、定罪上千人。此案后,民间开始自发挖除避讳敏感词。康熙八年,16岁的康熙帝除掉鳌拜后开始亲政。朝廷开始明确要求避讳皇帝名讳,官员士绅也需要遵守新的避讳规范。康熙帝要求各地编写地方志的起点是康熙十一年(1672年),服务于《大清一统志》的纂修。康熙二十二年(1683年)、康熙二十三年(1684年)两次强化政令,实现从省志到县志的全国覆盖。

通过查找,文中涉及“玄”“胤禛”“弘历”名讳并没有改字现象,但“烨”进行了挖除。“玄”字大量出现而未被修改,“烨”在文中只出现一次就被挖除,这种现象非同寻常,证明该哈佛版刊刻在清朝康熙初期,此时虽有文字避讳,但“玄”字因为大量使用,民间并未避讳。因此得出结论,刊刻时间应该在康熙二十三年(1684年)之前,甚至更早些。

合成举例三(以成文版和学生书局为底本,日本国会版为对校本)

上文说过由于成文版因具有版面完整的特性,因此在查找缺页的时候非常方便。我在整理过程中,最终选用了成文版作为底本,但发现成文版因为内容经过后人讹补,造成了较大学术误会。

经过“古籍数字合成对校法”使用,发现有一些地方无法将成文版和哈佛版合成,当时并未在意。后来发现成文版有整本缺失并且有整本补写,这就有非常大的造假嫌疑。经过补写的位置有卷十一卷首、卷十四卷尾、卷十五卷首、卷十八卷首、卷二十五卷首、卷三十五整卷、卷三十六整卷、卷三十七整卷、卷四十二卷尾,这些内容经过补写的内容高达一万六千字。

古籍造假偶尔发生,但地方志造假比较罕见。造假者需要有足够多知识储备,并且有阔绰的资金。经过关键字查找,造假者可能参考了万历年间的《隆庆州志》,并加以适当地杜撰,形成了非常具有迷惑性的手抄本。我推测这是为了凑齐全本高价出售而做出的投机行为。

研究宣府镇志的学者,务必掌握辨别是非的能力,这一万六千多字讹误,已经造成巨大的误解。比如,台湾成文出版社、台湾学生书局都对这部书做了完整影印,但并未发现其中补写造假。丛书《地方志人物传记资料丛刊》华北卷第十四册误将成文版三十五到三十七卷录入。近年有学者在研究南瓜传入中国的问题时,误将此嘉靖志中补写的记载当作原始文献引用,导致其关于南瓜起源地的结论出现偏差,误认为宣府。

总结

“古籍数字合成对校法”在古籍整理时有着非常显著的作用,希望我公布这几个应用实例能够对古籍的“再生性保护”提供有效的方法,为高质量整理、影印、数据库建设提供更清晰的底本,更希望国内的古籍保护能有巨大的飞跃!

作者简介:高彩蛟,张家口宣化人,中共党员,中国古籍保护协会会员,古籍数字合成对校法发明者,正德《宣府镇志》、嘉靖《宣府镇志》、康熙《新续宣府志》、康熙《宣化县志》点校者。