[发明专利]甲骨文字识别模型及训练方法、系统、设备、计算机介质在审
申请号: | 201910180571.0 | 申请日: | 2019-03-11 |
公开(公告)号: | CN109871904A | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 陈锐;吴宗泽;任志刚 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 510060 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 甲骨文 卷积 连接层 池化 计算机介质 图文数据 测试集 训练集 卷积核 申请 | ||
本申请公开了一种甲骨文字识别模型及训练方法、系统、设备及计算机介质,该方法包括获取甲骨文图文数据集,将甲骨文图文数据集划分为训练集和测试集;基于训练集和测试集对甲骨文字识别模型进行训练,得到训练好的甲骨文字识别模型,以基于训练好的甲骨文字识别模型对目标甲骨文字进行识别;其中,甲骨文字识别模型包括:第一卷积层、第一最大池化层、第二卷积层、第二最大池化层、第三卷积层、第四卷积层、第五卷积层、第三最大池化层、第一全连接层、第二全连接层,第三全连接层;且第一卷积层的卷积核尺寸大于11×11。本申请提供的甲骨文字识别模型可以自动对目标甲骨文字进行识别,提高了甲骨文字识别的识别效率。
技术领域
本申请涉及卷积神经网络模型技术领域,更具体地说,涉及甲骨文字识别模型及训练方法、系统、设备、计算机介质。
背景技术
甲骨文字作为古文字还未进入国家标准,也未进入国际标准,所以甲骨文字在出版物上是以图片出现,这位甲骨文字的检索带来了困难。
为了检索甲骨文字,现有的甲骨文字识别方法包括基于SVM(Support VectorMachine,支持向量机)的甲骨文字识别和基于分形几何的甲骨文字识别方法。
然而,基于SVM的甲骨文字识别需要采用分块直方图的方式,即手工提取的方式,来提取文字特征;而基于分形几何的甲骨文字识别方法利用分形几何的原理,通过计算字形以及各个象限的分形维数,将甲骨文字形式化为一组分形描述码,再通过与甲骨文字的分形特征库进行配准,得到识别结果,其同样需要人工干预过程。也即,现有的基于SVM的甲骨文字识别和基于分形几何的甲骨文字识别方法均需要人工参与,识别效率较低。
综上所述,如何提高甲骨文字识别的识别效率是目前本领域技术人员亟待解决的问题。
发明内容
本申请的目的是提供一种甲骨文字识别模型训练方法,其能在一定程度上解决如何提高甲骨文字识别的识别效率的技术问题。本申请还提供了一种甲骨文字识别模型及训练系统、设备及计算机可读存储介质。
为了实现上述目的,本申请提供如下技术方案:
一种甲骨文字识别模型训练方法,包括:
获取甲骨文图文数据集,在所述甲骨文图文数据集中划分出训练集;
基于所述训练集对所述甲骨文字识别模型进行训练,得到训练好的甲骨文字识别模型,以基于所述训练好的甲骨文字识别模型对目标甲骨文字进行识别;
其中,所述甲骨文字识别模型包括依次连接的第一卷积层、第一最大池化层、第二卷积层、第二最大池化层、第三卷积层、第四卷积层、第五卷积层、第三最大池化层、第一全连接层、第二全连接层、第三全连接层;且所述第一卷积层的卷积核尺寸大于11×11。
优选的,所述在所述甲骨文图文数据集中划分出训练集之后,所述基于所述训练集对所述甲骨文字识别模型进行训练之前,还包括:
基于所述训练集对所述甲骨文字识别模型对应的浅层模型进行训练,得到训练好的浅层模型;
将所述训练好的浅层模型的权值作为所述甲骨文字识别模型的初始权值;
其中,所述浅层模型包括依次连接的所述第一卷积层、所述第二卷积层、所述第三卷积层、所述第一最大池化层、所述第二最大池化层、所述第三最大池化层、所述第一全连接层、所述第二全连接层和所述第三全连接层。
优选的,所述获取甲骨文图文数据集,在所述甲骨文图文数据集中划分出训练集,包括:
获取所述甲骨文图文数据集;
将所述甲骨文图文数据集中的原始图像像素变换为256×256,得到第一变换图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910180571.0/2.html,转载请声明来源钻瓜专利网。