古地图文字自动识别与检索系统

基于深度学习的古代地图的自动识别与信息提取


1-22022Q3340G55.jpg




详情介绍:

古地图文字自动识别与检索系统是利用深度学习神经网络技术结合大量古代原版地图训练出的能够从古代地图中自动提取和识别文字的智能识别系统,可拓展利用为不同时期地名对比及地方志的修撰工作。


操作流程

1.上传地图;

2.系统自动检测并识别地图中文字;

3.用户对系统检测及识别结果进行校正修改;

4.导出识别结果并可根据用户需要进行后期操作(添加地名链接、查看地名信息等)。


1-22022622403aA.png

      


关键技术

人工干预识别过文档

应用过程是识别待识别手写汉字图片的过程。此过程中,首先输入要识别的汉字图片,接着输出识别结果。针对识别过的古文献文档进行文字校对、文本框的调整及古文本的行/列切分的微调。针对识别错误的文字不但要更正一下,而且将正确的古文字图片添加到图片词典中去。另外要注意的地方古文献中文字是繁体字要处理成繁体字,是简体字要处理成简体字,这一点对研究者来说很重要的。

以上这些步骤即增加卷积神经网络识别图片词库量,也提升人工智能对古文献的识别正确率。

微信图片_20231204140558.png