[发明专利]文字的类型识别方法、装置、设备及存储介质有效
申请号: | 201910008330.8 | 申请日: | 2019-01-04 |
公开(公告)号: | CN109840524B | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 吴启 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/244 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 黄章辉 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及计算机技术领域,提供了一种文字的类型识别方法、装置、设备及存储介质,所述方法包括:根据文字检测模型中的卷积神经网络视觉几何组结构的输入层的定义,对文字图像进行预处理,得到基础文字图像;根据卷积层的定义,对基础文字图像进行文字的特征提取,得到文字特征矩阵;根据循环神经网络结构的映射层的定义,按照预设的映射条件,对文字特征矩阵进行维度映射,得到目标特征向量;根据卷积神经网络结构的二分类层的定义,对目标特征向量进行二分类计算,得到文本向量;根据目标分类层的定义,计算文本向量的每个分量的得分,并选取数值最大的得分对应的预设文字类型,作为类型识别结果。本发明能够提高对文字的类型识别的效率。 | ||
搜索关键词: | 文字 类型 识别 方法 装置 设备 存储 介质 | ||
【主权项】:
1.一种文字的类型识别方法,其特征在于,所述文字的类型识别方法包括:获取待处理的文字图像,并将所述文字图像输入预设的文字检测模型,其中,所述文字检测模型包括卷积神经网络视觉几何组结构、循环神经网络结构和卷积神经网络结构;根据所述卷积神经网络视觉几何组结构的输入层的定义,对所述文字图像进行预处理,得到预处理后的基础文字图像;根据所述卷积神经网络视觉几何组结构的卷积层的定义,对所述基础文字图像中的目标文字进行文字的特征提取,得到所述目标文字对应的文字特征矩阵;根据所述循环神经网络结构的映射层的定义,按照预设的映射条件,对所述文字特征矩阵进行维度映射,得到所述文字特征矩阵对应的目标特征向量,其中,所述目标特征向量中的每个分量对应一种预设文字类型;根据所述卷积神经网络结构的二分类层的定义,对所述目标特征向量进行二分类计算,并根据计算结果确定所述目标特征向量的文本类别,将所述文本类别为文字的目标特征向量作为文本向量;根据所述卷积神经网络结构的目标分类层的定义,计算所述文本向量的每个所述分量的得分,并从所述得分中选取数值最大的得分对应的所述预设文字类型,作为所述文本向量对应的所述目标文字的类型识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910008330.8/,转载请声明来源钻瓜专利网。