[发明专利]发票识别方法及相关模型的训练方法以及相关设备、装置在审
申请号: | 202010526072.5 | 申请日: | 2020-06-11 |
公开(公告)号: | CN111814785A | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 赵诗云;陈媛媛 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 黎坚怡 |
地址: | 310051 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 发票 识别 方法 相关 模型 训练 以及 设备 装置 | ||
本申请公开了一种发票识别方法及相关模型的训练方法以及相关设备、装置,其中,发票识别方法包括:获取待识别发票图像;利用文本检测模型对待识别发票图像进行检测,得到待识别发票图像中的若干子文本区域;将满足预设距离条件的子文本区域合并得到目标文本区域;利用文本识别模型对目标文本区域进行文本识别,得到待识别发票图像的发票信息。上述方案,能够提高发票识别的准确性。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种发票识别方法及相关模型的训练方法以及相关设备、装置。
背景技术
发票识别是企业财务、税务机关等进行纳税申报、发票稽核、税务稽核、财务管理等工作的重要基础。以往一般采用人工录入的方式实现发票识别,需要消耗大量的人力成本和时间成本。
随着信息技术的提高,人们越来越广泛地使用手机、计算机等电子设备对发票图像进行识别。然而,在实际应用时,发票中一般包含诸如名称、纳税人识别号等行间距较小的长文本,相互之间极易产生干扰,且发票图像还难免存在背景、亮度不均等其他干扰,从而影响发票识别的准确性。有鉴于此,如何提高发票识别的准确性成为亟待解决的问题。
发明内容
本申请主要解决的技术问题是提供一种发票识别方法及相关模型的训练方法以及相关设备、装置,能够提高发票识别的准确性。
为了解决上述问题,本申请第一方面提供了一种发票识别方法,包括:获取待识别发票图像;利用文本检测模型对待识别发票图像进行检测,得到待识别发票图像中的若干子文本区域;将满足预设距离条件的子文本区域合并得到目标文本区域;利用文本识别模型对目标文本区域进行文本识别,得到待识别发票图像的发票信息。
为了解决上述问题,本申请第二方面提供了一种文本检测模型的训练方法,包括:获取样本发票图像,其中,样本发票图像中标注有与各目标文本的子文本对应的实际子文本区域;利用文本检测模型对样本发票图像进行检测,得到样本发票图像中与各目标文本的子文本对应的预测子文本区域;利用实际子文本区域与预测子文本区域,确定文本检测模型的损失值;利用损失值,调整文本检测模型的参数。
为了解决上述问题,本申请第三方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的发票识别方法,或实现上述第二方面中的文本检测模型的训练方法。
为了解决上述问题,本申请第四方面提供了一种存储装置,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的发票识别方法,或实现上述第二方面中的文本检测模型的训练方法。
上述方案,通过利用文本检测模型对获取的待识别发票进行检测,从而得到待识别发票中的若干子文本区域,并将满足预设距离条件的子文本区域合并得到目标文本区域,进而利用文本识别模型对目标文本区域进行文本识别,得到待识别发票的发票信息,故通过文本检测模型对待识别发票进行检测,以及通过文本识别模型对目标文本区域进行文本识别,能够不受背景、亮度等干扰,且由于文本检测模型能够检测得到待识别发票中若干子文本区域,并对子文本区域进行合并得到对应一目标文本区域,故能够降低目标文本区域重叠的概率,从而能够降低目标文本之间的相互干扰,进而能够提高发票识别的准确性。
附图说明
图1是本申请发票识别方法一实施例的流程示意图;
图2是图1中待识别发票图像一实施例的示意图;
图3是图1中步骤S13一实施例的流程示意图;
图4是本申请文本检测模型的训练方法一实施例的流程示意图;
图5是本申请发票识别装置一实施例的框架示意图;
图6是本申请文本检测模型的训练装置一实施例的框架示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010526072.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:关联检测方法以及相关设备、装置
- 下一篇:动态雕塑机构