[发明专利]发票信息的识别方法、装置、电子设备及存储介质有效
申请号: | 202010009796.2 | 申请日: | 2020-01-06 |
公开(公告)号: | CN111209856B | 公开(公告)日: | 2023-10-17 |
发明(设计)人: | 张秋晖;刘岩;韩森尧;朱兴杰 | 申请(专利权)人: | 泰康保险集团股份有限公司 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V30/413;G06V30/148;G06V30/164;G06V10/82;G06N3/0464 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杜叶蕊;臧建明 |
地址: | 100031 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 发票 信息 识别 方法 装置 电子设备 存储 介质 | ||
1.一种发票信息的识别方法,其特征在于,包括:
对待处理发票的图像信息进行预处理,获得发票数据;
将所述发票数据输入训练完毕的发票位置识别模型,输出所述发票图像信息中的待识别发票区域;
将所述待识别发票区域的图像输入至OCR识别模型,以使确定所述待识别发票区域中是否包括有预设字段,若是,则所述第一识别结果为第一类型发票,若否,则所述第一识别结果为非第一类型发票;
将所述待识别发票区域的图像输入至训练完毕的发票类型识别模型,以对所述待处理的发票类型进行识别获得所述待处理发票属于各发票类型的第一概率,将根据各第一概率确定的所述待处理发票的发票类型作为所述第二识别结果;
根据第一识别结果和第二识别结果确定所述待处理发票的识别结果。
2.根据权利要求1所述的识别方法,其特征在于,所述训练完毕的发票位置识别模型包括:依次连接的多个卷积池化层;
所述将所述发票数据输入训练完毕的发票位置识别模型,输出所述发票图像信息中的待识别发票区域,包括:
将所述发票数据输入训练完毕的发票位置识别模型,以使所述发票数据依次通过所述训练完毕的发票位置识别模型中的各卷积池化层并输出待识别发票区域在所述待处理发票的图像信息中的角点坐标,以及所述发票区域的置信度;其中,所述发票区域的置信度用于表示所述角点坐标的可信程度。
3.根据权利要求1所述的识别方法,其特征在于,所述确定所述待识别发票区域中是否包括有预设字段之前,包括:
根据所述待识别发票区域对所述图像信息进行图像分割,获得所述待识别发票区域对应的图像。
4.根据权利要求1所述的识别方法,其特征在于,所述根据第一识别结果和第二识别结果确定所述待处理发票的识别结果,包括:
当所述第一识别结果为第一类型发票时,所述待处理发票的识别结果为第一类型发票;
当所述第一识别结果为非第一类型发票时,则根据第一识别结果和第二识别结果确定所述待处理发票的识别结果。
5.根据权利要求1所述的识别方法,其特征在于,当确定所述待识别发票区域中不包括有预设字段时,所述识别方法还包括:
统计待识别发票区域中的字段分布,并根据预设的字段分布和发票类型之间的概率对应表,确定所述待识别发票属于各发票类型的第二概率;
相应的,所述根据第一识别结果和第二识别结果确定所述待处理发票的识别结果,包括:
将所述各发票类型的第一概率和第二概率相加,以根据相加结果确定所述待识别发票的识别结果。
6.根据权利要求1-5任一项所述的识别方法,其特征在于,所述预处理包括如下处理中的一种或多种:锐化处理,去噪处理,旋转处理。
7.根据权利要求6所述的识别方法,其特征在于,锐化处理用于补偿待处理发票的图像信息的轮廓;所述去噪处理用于去除所述补偿待处理发票的图像信息的噪声;所述旋转处理用于以待处理发票的图像信息中的某一像素点为中心,对所述待处理发票的图像信息进行旋转操作。
8.一种发票信息的识别装置,其特征在于,包括:
预处理模块,用于对待处理发票的图像信息进行预处理,获得发票数据;
处理模块,用于将所述发票数据输入训练完毕的发票位置识别模型,输出所述发票图像信息中的待识别发票区域;
识别模块,将所述待识别发票区域的图像输入至OCR识别模型,以使确定所述待识别发票区域中是否包括有预设字段,若是,则所述第一识别结果为第一类型发票,若否,则所述第一识别结果为非第一类型发票;将所述待识别发票区域的图像输入至训练完毕的发票类型识别模型,以对所述待处理的发票类型进行识别获得所述待处理发票属于各发票类型的第一概率,将根据各第一概率确定的所述待处理发票的发票类型作为所述第二识别结果;还用于根据第一识别结果和第二识别结果确定所述待处理发票的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司,未经泰康保险集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010009796.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息分享方法以及装置
- 下一篇:一种基于肌电信号的双向递归肌电特征选择方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置