[发明专利]基于文本超分辨的甲骨文识别在审
申请号: | 202110323005.8 | 申请日: | 2021-03-26 |
公开(公告)号: | CN113642578A | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 刘杰;祁箬;葛一凡 | 申请(专利权)人: | 哈尔滨理工大学 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/32;G06K9/46;G06N3/04;G06N3/08;G06T3/40 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150080 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文本 分辨 甲骨文 识别 | ||
本发明公开了一种甲骨文字识别方法,涉及图像文本超分辨和图像文字识别领域,包括以下步骤,S0:输入待测的甲骨文拓片图像;S1:采用HR图像和LR图像对SRGAN网络进行训练;S2:使用SRGAN技术对图像进行超分辨预处理,以提高甲骨文字图像分辨率,降低噪声;S3:对预处理之后的甲骨文图像集合输入到训练好的端到端CRNN识别模型中。本发明结合文本图像SR算法与CRNN文本识别算法,对甲骨文字拓片图像进行识别,不需要手工特征及二值化分割等预处理,降低了低分辨率导致的识别困难,提高了识别的准确率。
技术领域
本发明涉及文本图像超分辨及图像文字识别领域,具体涉及基于文本超分辨的甲骨文识别。
背景技术
中国古代的甲骨文是世界上最著名的古代文字系统之一,甲骨文的识别与破译是甲骨文研究的重要课题之一。有些甲骨文字已经有了一定程度的解释。然而,这些结果是由专家手工完成的,这种手工方法需要高水平的专业知识,使得这样的研究非常昂贵,并且进一步阻碍了甲骨文识别和破译的进展。因此,一种高效、有效的甲骨文研究技术是当前和未来甲骨文研究的迫切需要。
目前,基于深度学习的甲骨文字识别都是监督方式的。常见的甲骨单字图像有甲骨字模图像和拓片文字图像两种,真正意义的甲骨文字识别工作需要在拓片文字数据集上进行,甲骨磨损、拓印噪声和甲骨纹理干扰对识别结果影响很大,从公开报道结果来看,整体识别率都不理想,最高的仅为70%左右。基于文本超分辨的甲骨文识别主要包含文本图像超分辨和文本图像识别两个部分。
发明内容
本发明提供了甲骨文字拓片图像的识别方法,降低了低分辨率导致的识别困难,提高了识别的准确率。
本发明技术方案为基于文本超分辨的甲骨文识别,所述方案包括以下步骤:
S0:输入待测的甲骨文拓片图像;
S1:采用HR图像和LR图像对SRGAN网络进行训练;
S2:使用SRGAN技术对图像进行超分辨预处理,以提高甲骨文字图像分辨率,降低噪声;
S3:对预处理之后的甲骨文图像集合输入到训练好的端到端CRNN识别模型中。
所述步骤S0的操作过程如下:
S00:在互联网上下载获取拓片甲骨文字的图像数据集;
S01:图像数据集的75%作为训练集,25%作为测试集供后续训练与验证。
所述步骤S1的操作过程如下:
S10:SRGAN是一种用于图像超分辨率(SR)的生成对抗网络(GAN),利用感知损失(perceptual loss)和对抗损失(adversarial loss)来提升恢复出的图片的真实感,能够在公共基准测试中从严重下采样的图像中恢复照片般逼真的纹理,从其低分辨率 (LR)对应物估计高分辨率(HR)图像;
S11:将真实的高分辨率图像和虚假的高分辨率图像传入判别模型中,分别将判别结果与1和0做对比,利用对比得到的loss进行训练;
S12:将低分辨率图像传入生成模型,得到高分辨率图像,利用该高分辨率图像获得判别结果与1进行对比。将真实的高分辨率图像和虚假的高分辨率图像传入VGG 网络,获得两个图像的特征并比较获得loss;
S13:训练过程中,固定一方,更新另一方的网络权重,交替迭代,在这个过程中,形成竞争对抗,直到双方达到一个动态的平衡,公式如下:
其中,x表示真实的图像,z表示输入的G网络噪声,G(z)表示G网络生成的图像。D(x)表示真实输入的概率,D(G(z))表示D网络判断G生成的图像是否真实的概率。
所述步骤S2的操作过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110323005.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于机器学习的PLC语音识别方法
- 下一篇:具有堆叠层的边缘耦合器