[发明专利]文本识别方法以及电子设备、存储装置在审
申请号: | 202110204628.3 | 申请日: | 2021-02-23 |
公开(公告)号: | CN112949653A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 程志鹏;胡金水;谢名亮;董健;刘驰;吴爱红;李立夫 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/08 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何倚雯 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 识别 方法 以及 电子设备 存储 装置 | ||
1.一种文本识别方法,其特征在于,包括:
获取待识别图像;其中,所述待识别图像内含有至少一个目标文本;
对所述待识别图像进行特征提取,得到所述待识别图像的特征图;
利用所述特征图进行目标检测,得到分别与所述至少一个目标文本对应的目标区域;
识别所述目标区域中的目标文本和所述目标文本的文本类型。
2.根据权利要求1所述的方法,其特征在于,所述识别所述目标区域中的目标文本和所述目标文本的文本类型,包括:
对所述目标区域进行分类检测,得到所述目标区域对应的目标文本的文本类型,并对所述目标区域进行文字识别,得到若干识别文字;
基于所述文本类型,对所述若干识别文字进行校正,得到所述目标文本。
3.根据权利要求2所述的方法,其特征在于,所述基于所述文本类型,对所述若干识别文字进行校正,包括:
剔除所述若干识别文字中不属于所述文本类型的识别文字;
和/或,在所述文本类型为地址的情况下,按照行政区划的顺序,利用预设地址信息库对所述若干识别文字进行校正;
和/或,在所述文本类型为单位名称的情况下,搜索属于纳税人识别号的识别文字作为第一参考文字,并利用所述第一参考文字对所述若干识别文字进行校正;
和/或,在所述文本类型为纳税人识别号的情况下,搜索属于单位名称的识别文字作为第二参考文字,并利用所述第二参考文字对所述若干识别文字进行校正;
和/或,在所述文本类型为金额的情况下,搜索属于预设类型的识别文字作为第三参考文字,并利用所述第三参考文字对所述若干识别文字进行校正。
4.根据权利要求1所述的方法,其特征在于,所述利用所述特征图进行目标检测,得到分别与所述至少一个目标文本对应的目标区域,包括:
利用所述特征图进行第一检测,得到分别与所述至少一个目标文本对应的候选区域;
分别对所述至少一个目标文本对应的候选区域进行第二检测,得到分别与所述至少一个目标文本对应的目标区域。
5.根据权利要求4所述的方法,其特征在于,同一所述目标文本对应的所述候选区域与所述目标区域之间满足预设关系,且所述预设关系包括:所述候选区域不小于所述目标区域。
6.根据权利要求1所述的方法,其特征在于,所述目标区域和所述文本类型是利用文本检测模型检测得到的,所述文本检测模型是利用样本图像训练得到的,且所述样本图像标注有样本目标文本的样本目标区域和样本文本类型。
7.根据权利要求6所述方法,其特征在于,所述文本检测模型的训练步骤包括:
利用所述文本检测模型的特征提取网络对所述样本图像进行特征提取,得到所述样本图像的样本特征图;
利用所述文本检测模型的目标检测网络对所述样本特征图进行目标检测,得到所述样本目标文本的预测目标区域;以及,
利用所述文本检测模型的分类检测网络对所述预测目标区域进行分类检测,得到所述预测目标区域对应的样本目标文本的预测文本类型;
基于所述样本目标区域和所述预测目标区域之间的差异,得到所述文本检测模型的检测损失值,并基于所述样本文本类型和所述预测文本类型之间的差异,得到所述文本检测模型的分类损失值;
基于预设检测权值、预设分类权值对所述检测损失值、分类损失值的加权结果,调整所述文本检测模型的网络参数;
其中,所述预设检测权值不大于所述预设分类权值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110204628.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:气体流量测量装置及方法
- 下一篇:编码器组件