[发明专利]一种基于空间近邻关系的甲骨文自动标注方法有效

专利信息
申请号: 202010072173.X 申请日: 2020-01-21
公开(公告)号: CN111291750B 公开(公告)日: 2023-03-24
发明(设计)人: 张重生;曹爽;史先进;凡高娟;门艺;夏瑞雪;沈夏炯;莫伯峰;余波;郑逢斌 申请(专利权)人: 河南大学
主分类号: G06V30/146 分类号: G06V30/146;G06V30/148;G06V30/19;G06V30/30
代理公司: 郑州睿途知识产权代理事务所(普通合伙) 41183 代理人: 李伊宁
地址: 475001 河南*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 空间 近邻 关系 甲骨文 自动 标注 方法
【说明书】:

发明公开了一种基于空间近邻关系的甲骨文自动标注方法,包括以下步骤:A:对甲骨字符进行定位;B:对甲骨字符图像进行识别;C:选取待定锚点甲骨字;D:选取锚点甲骨字符图像;E:判断锚点甲骨字在甲骨字原文中的位置,进入下一个甲骨字符图像和/或上一个甲骨字符图像搜索;F:进行下一个甲骨字符图像搜索;G:进行上一个甲骨字符图像搜索;H:进行下一个和上一个甲骨字符图像搜索;I:完成甲骨字符图像的字符级别的标注。本发明能够快速高效地实现甲骨文拓片图像的字符级别的标注,即在甲骨文拓片图像上自动定位出甲骨文字位置,并对应显示出相应的甲骨字。

技术领域

本发明涉及一种甲骨文自动标注方法,尤其涉及一种基于空间近邻关系的甲骨文自动标注方法。

背景技术

甲骨文是迄今为止我国发现的年代最早的成熟文字系统,是汉字的源头和中华优秀传统文化的根脉。甲骨文的研究,始终受到国家与社会各方的高度重视。由于甲骨文字存在年代久远、甲骨残缺和甲骨图像不清晰等原因,目前可识字仅有3000余个,仍存在大量的不可识字。同时,不少甲骨文字在古文字领域内仍存在歧义现象,对甲骨文识别带来巨大的挑战。

随着图像检测和图像识别算法的广泛应用,基于图像检测和图像识别算法的甲骨文字研究也得到了快速发展。在涌现的大量图像检测和图像识别算法中,较为常见的是基于文本行或者文本序列的识别。现有识别方式大多通过构建按文本行标注的数据集,进而对图像进行检测和识别,来验证其算法的准确性。然而在甲骨文图像数据集内,由于每一句的甲骨文相对分散,基于文本行的图像识别存在很大的困难。同时,甲骨图像本身还存在大量纹路,进一步加剧了图像识别的困难。

基于上述情况,如何高效的进行基于字符级的甲骨文图像识别,其关键问题在于如何实现基于字符的数据标注。现有的甲骨标注中,仅仅对每个甲骨文拓片图像提供了篇幅级别的标注,即该甲骨文拓片图像中有哪几句话,每句话中有哪些文字,但没有提供每幅图像中、每句话以及每句话中的每个甲骨字在甲骨文拓片图像中的具体坐标位置(矩形框),而无法实现字符级别的甲骨图像标注。而要实现字符级别的甲骨图像标注,在现有技术环境下,只能通过在甲骨文拓片上进行大量的人工标注,且需要大量古文字领域专业人士的参与,同时还需耗费大量的人力、物力、财力和时间成本。

发明内容

本发明的目的是提供一种基于空间近邻关系的甲骨文自动标注方法,能够结合现有甲骨文拓片图像及该甲骨文拓片图像的篇幅级别的标注,快速高效地实现甲骨文拓片图像的字符级别的标注,即在甲骨文拓片图像上自动定位出甲骨文字位置,并对应显示出相应的甲骨字。

本发明采用下述技术方案:

一种基于空间近邻关系的甲骨文自动标注方法,包括以下步骤:

A:使用文字定位算法,对甲骨文拓片图像上的每一个甲骨字符进行定位并得到定位结果;

B:使用甲骨文识别算法,对甲骨文拓片图像上的每一个甲骨字符图像进行识别,并将每一个甲骨字符图像的识别结果按照可能性从大到小排序,输出每一个甲骨字符图像的前K个识别结果;

C:根据给定的甲骨字原文,将甲骨字原文中所有的甲骨字逐一在现有甲骨文数据库中进行检索,选取出现频率不小于Q次的甲骨字作为待定锚点甲骨字;

D:将步骤C中得到的所有的待定锚点甲骨字,与步骤B中得到的每一个甲骨字符图像的前K个识别结果进行对比,选取出待定锚点甲骨字和识别结果中共有的甲骨字作为锚点甲骨字,锚点甲骨字所对应的甲骨字符图像作为锚点甲骨字符图像;

E:判断步骤D中得到的锚点甲骨字在甲骨字原文中的位置,若锚点甲骨字在甲骨字原文中为第一个甲骨字,则进入步骤F;若锚点甲骨字在甲骨字原文中为最后一个甲骨字,则进入步骤G;锚点甲骨字在甲骨字原文中为中间的甲骨字,则进入步骤H;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南大学,未经河南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010072173.X/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top