[发明专利]票据识别方法、装置、电子设备以及存储介质有效
申请号: | 202210211125.3 | 申请日: | 2022-03-03 |
公开(公告)号: | CN114821603B | 公开(公告)日: | 2023-09-01 |
发明(设计)人: | 何烩烩;王佳阳;向宇波 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V10/774;G06V10/82;G06N3/0464;G06N3/08;G06N3/044 |
代理公司: | 北京猷德知识产权代理有限公司 16084 | 代理人: | 范继晨 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 票据 识别 方法 装置 电子设备 以及 存储 介质 | ||
1.一种票据识别方法,包括:
获取待识别的目标票据,其中,所述目标票据包括多个文本块;
分别对所述多个文本块在所述目标票据上的二维位置信息进行编码处理,得到多个编码结果,其中,所述多个编码结果与所述多个文本块一一对应;
分别对所述多个编码结果进行图卷积处理,得到多个卷积结果,其中,所述多个卷积结果与所述多个编码结果一一对应;
基于第一条件随机场模型对每个所述卷积结果进行识别,得到所述目标票据的文本块级别的第一预测结果,其中,所述第一条件随机场模型与第二条件随机场模型协同训练,所述第二条件随机场模型用于对每个所述卷积结果进行识别,以得到所述目标票据的字级别的第二预测结果,所述第一预测结果用于表示所述目标票据中关键字对应的结构化信息。
2.根据权利要求1所述的方法,所述编码结果包括每个所述文本块对应的字级别的第一隐藏层向量,基于第一条件随机场模型对每个所述卷积结果进行识别,得到所述目标票据的文本块级别的第一预测结果包括:
将字级别的每个所述卷积结果和所述第一隐藏层向量二者之间的和,转换为字级别的第二隐藏层向量;
基于所述第二隐藏层向量确定对应的每个所述文本块的第一文本块向量;
基于所述第一条件随机场模型对每个所述文本块的第一文本块向量进行识别,得到所述第一预测结果。
3.根据权利要求2所述的方法,还包括:
基于所述第二条件随机场模型对所述第二隐藏层向量进行识别,得到所述第二预测结果。
4.根据权利要求1所述的方法,还包括:
基于所述第一条件随机场模型的第一损失函数和所述第二条件随机场模型的第二损失函数,训练得到所述第一条件随机场模型。
5.根据权利要求4所述的方法,基于所述第一条件随机场模型的第一损失函数和所述第二条件随机场模型的第二损失函数,训练得到所述第一条件随机场模型,包括:
获取所述第一损失函数和所述第二条件随机场模型的第二损失函数二者之和;
基于所述训练得到所述第一条件随机场模型。
6.根据权利要求1所述的方法,所述二维位置信息包括每个所述文本块在所述目标票据上的二维坐标值,其中,分别对所述多个文本块在所述目标票据上的二维位置信息进行编码处理,得到多个编码结果包括:
确定所述二维坐标值对应的目标坐标向量;
对所述目标坐标向量进行编码处理,得到每个所述编码结果。
7.根据权利要求6所述的方法,其中,所述二维坐标值包括每个所述文本块的文本框的第一角的第一二维坐标值和第二角的第二二维坐标值,所述第一角和所述第二角位于所述文本框的对角线上,其中,确定所述二维坐标值对应的目标坐标向量,包括:
确定所述第一二维坐标值对应的第一坐标向量和所述第二二维坐标值对应的第二坐标向量;
将所述第一坐标向量与所述第二坐标向量二者之间的和,确定为所述目标坐标向量。
8.根据权利要求6所述的方法,还包括:
基于每个所述文本块的尺寸信息,将所述目标坐标向量的向量维度由原始向量维度调整到目标向量维度,其中,所述目标向量维度大于所述原始向量维度;
其中,对所述目标坐标向量进行编码处理,得到每个所述编码结果包括:对所述目标向量维度的所述目标坐标向量进行编码处理,得到每个所述编码结果。
9.根据权利要求8所述的方法,还包括:
将每个所述文本块转换为字级别向量;
其中,对所述目标向量维度的所述目标坐标向量进行编码处理,得到每个所述编码结果包括:对所述字级别向量和所述目标向量维度的所述目标坐标向量进行编码处理,得到每个所述编码结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210211125.3/1.html,转载请声明来源钻瓜专利网。