原网站入口 | OA系统

国家社科基金 | 重大项目“甲骨文材料整理和图文数据库建设”以优秀等级结项

发布时间:2022-03-25

|

来源:省社科联

浏览:

项目基本情况

以浙江大学曹锦炎教授为首席专家的国家社科基金重大招标项目“甲骨文材料整理及图文数据库建设”(批准号:15ZDB093),经浙江省社科联组织专家评审、全国哲学社会科学工作办公室审核,以“优秀”等级结项(结项证书号:2021&J195)。

主要内容和重要观点

本课题通过对已经公布的国内外所藏商代刻辞甲骨中全部材料作重新梳理,加以综合、排比,以词为目,将所有相关辞例的著录情况进行汇集,编辑成索引性质的《甲骨文分类通检》。并按每个词目下所有著录的片号,将相关辞例的内容整理后进行辑录,同时结合甲骨文基础字形的全面整理,研究的最终成果为甲骨文图文数据库。

数据库将最新的人工智能技术引入于甲骨学研究,探索甲骨文数据库的建设方向、分类检索途径及自由使用的其他场景,最终为建立甲骨学数据大平台提供服务和基础。完成的数据库收录甲骨卜辞条目13万9千余条,隶定释文118万余字,卜辞摹写118万余字,收录拓本6万余片、字形(包括单字和合文)5万多字,采用的甲骨文著录书达70余种。

甲骨文图文数据库采用BS架构,存储的基础数据包括拓片数据库、字形数据库、卜辞词条数据库、释文数据库和摹本数据库五个部分。项目应用计算机视觉研究中的最新进展,实现了拓片自动切割和校对模块,完善了甲骨文和隶定字矢量字体生成的技术,开发了甲骨文字形模糊识别方法以及甲骨文字形切割算法等内容。

本数据库基于基础数据之间的关联情况,结合项目研究的多项关键技术,能够提供对各类字符信息和拓片图像信息的全面管理、显示、查询的支持。数据库提供了单字检索、合文检索、拓片检索、摹本检索、手写检索、以图搜图检索等多种检索方式。其中的手写检索和以图搜图功能,是在数据库识别框内手写出甲骨文字形或粘贴、上传甲骨文图像,进而由数据库进行模糊识别,显示字形对应的释文,并关联对应词条,是本课题的一大亮点。

学术价值和应用价值

本课题涵盖了全部甲骨文知识和图像资料的种类,随着持续的录入和校对工作的进行,数据将越来越丰富。因此,利用本课题“甲骨文数据库”系统,可以拓展应用到甲骨文字形分类和字典、甲骨文资料分类研究工具书、甲骨文分类通检工具书、字形和拓片位置关联应用研究等论著的编纂方面。

本课题综合运用人工智能领域当前较为先进的深度学习方法和字符图像处理技术,研究建立具有较高识别率的甲骨文手写输入、识别、检索方法与系统,还研究了以图识图的方式在甲骨文检索中应用,可以直接将甲骨文的图像传入系统进行检索和考证出处。

另外,利用本课题“甲骨文图文数据库”建设过程中积累的研发技术,还可以拓展运用到金文等其他种类古文字的数据库建设。

项目负责人简介

曹锦炎,浙江大学艺术与考古学院教授,浙江大学“求是特聘教授”。原浙江大学文化遗产研究院院长,曾任浙江省博物馆副馆长、浙江省文物考古研究所所长。长期从事古文字及出土文献研究,在甲骨文研究、战国文字研究、吴越文字研究等方面成果突出,著述丰硕,出版专著十余种,发表论文近二百篇,是上海博物馆藏战国楚竹书的主要整理者之一。代表性著作有《甲骨文校释总集》《甲骨文字形表》《古玺通论》《鸟虫书通考》《鸟虫书字汇》《吴越历史与考古论丛》《披沙拣金——新出青铜器铭文论集》等。