[发明专利]文字识别方法和电子设备在审
申请号: | 202111473992.6 | 申请日: | 2021-12-02 |
公开(公告)号: | CN114494678A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 陈苏;王维晟;石光;吴志敏;金鑫;王宇;刘柏锋;焦亮 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 毛宏宝 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 识别 方法 电子设备 | ||
本发明提供一种文字识别方法和电子设备,方法包括:确定待识别图像,待识别图像包括待识别文字;获取文字种类信息,将待识别图像输入至文字种类识别模型,得到文字种类信息;文字种类识别模型基于卷积神经网络对待识别图像进行特征提取得到包含多维特征的目标特征图,对待识别图像的待识别文字进行文字种类识别;其中,文字种类识别模型是基于多个种类的待识别文字的样本图像训练得到的;确定与文字种类信息对应的文字检测识别模型;基于文字检测识别模型对待识别图像的待识别文字进行文字识别。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种文字识别方法和电子设备。
背景技术
现有方法中普遍通过人工检查图片信息进行图片中文字的识别,这种方式面 对互联网中海量的、多类型的图片数据进行文字识别的准确性和效率较差。
发明内容
本发明提供一种文字识别方法和电子设备,用以解决现有技术中通过人工检 查图片信息进行图片中文字的识别,这种方式面对互联网中海量的、多类型的图 片数据进行文字识别的准确性和效率较差的缺陷。
本发明提供一种文字识别方法,包括:
确定待识别图像,所述待识别图像包括待识别文字;
获取文字种类信息,将所述待识别图像输入至文字种类识别模型,得到所述 文字种类信息;所述文字种类识别模型基于卷积神经网络对所述待识别图像进行 特征提取得到包含多维特征的目标特征图,对所述待识别图像的待识别文字进行 文字种类识别;其中,所述文字种类识别模型是基于多个种类的待识别文字的样 本图像训练得到的;
确定与所述文字种类信息对应的文字检测识别模型;基于所述文字检测识别 模型对所述待识别图像的待识别文字进行文字识别。
根据本发明提供的一种文字识别方法,所述文字种类识别模型包括特征提取 层,所述特征提取层包括:
第一卷积层,用于通过预设第一卷积核对所述待识别图像进行卷积操作,得 到第一特征图;
第一线性变换层,用于通过预设第二卷积核对所述第一特征图线性变换,得 到与所述待识别图像尺寸一致的的第一抽象特征图;
池化层,用于对所述第一抽象特征图进行最大值池化,得到所述包含多维特 征的第一目标特征图。
根据本发明提供的一种文字识别方法,所述文字种类识别模型还包括:
场景分类层,用于对所述特征提取层输出的第一目标特征图进行场景分类, 得到所述待识别文字的文字种类信息。
根据本发明提供的一种文字识别方法,所述场景分类层包括:
第二卷积层,用于对所述第一目标特征图进行全卷积操作,得到第一目标一 维特征向量;
计算分类层,用于通过softmax函数对所述第一目标一维特征向量进行计算, 得到多个种类的场景分类概率;
分类输出层,用于从所述多个种类的场景分类概率中得到最大场景分类概率 对应的场景分类,将所述最大场景分类概率对应的场景分类作为所述文字种类信 息输出。
根据本发明提供的一种文字识别方法,所述确定待识别图像之前,文字识别 方法还包括对所述文字种类识别模型进行训练的步骤;所述对所述文字种类识别 模型进行训练,包括:
获取样本图像,所述样本图像包括待识别文字;
基于卷积神经网络对所述样本图像进行特征提取得到包含多维特征的第二 目标特征图;
对所述第二目标特征图进行场景分类,得到所述样本图像的待识别文字的文 字种类信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111473992.6/2.html,转载请声明来源钻瓜专利网。