[发明专利]识别文档中的键值对在审
申请号: | 202080016688.6 | 申请日: | 2020-02-26 |
公开(公告)号: | CN114072857A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 徐洋;王江;戴声扬 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V30/414;G06V10/82;G06Q30/04;G06N3/04;G06N3/08 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 邓聪惠;周亚荣 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 文档 中的 键值 | ||
1.一种由一个或多个数据处理装置执行的方法,所述方法包括:
向检测模型提供文档的图像,其中:
所述检测模型被配置成根据多个检测模型参数的值来处理所述图像以生成定义为所述图像生成的一个或多个边界框的输出;并且
为所述图像生成的每个边界框被预测成包围包括键文本数据和值文本数据的键值对,其中,所述键文本数据定义表征所述值文本数据的标签;以及
对于为所述图像生成的所述一个或多个边界框中的每个:
使用光学字符辨识技术来识别由所述边界框包围的文本数据;
确定由所述边界框包围的所述文本数据是否定义键值对;以及
响应于确定由所述边界框包围的所述文本数据定义键值对,提供所述键值对以用于在表征所述文档时使用。
2.根据权利要求1所述的方法,其中,所述检测模型是神经网络模型。
3.根据权利要求2所述的方法,其中,所述神经网络模型包括卷积神经网络。
4.根据权利要求2所述的方法,其中,在训练示例集合上训练所述神经网络模型,每个训练示例包括训练输入和目标输出,所述训练输入包括训练文档的训练图像,并且所述目标输出包括定义所述训练图像中各自包围相应的键值对的一个或多个边界框的数据。
5.根据权利要求1所述的方法,其中,所述文档是发票。
6.根据权利要求1所述的方法,其中,向检测模型提供文档的图像包括:识别所述文档的特定类别;以及将所述文档的所述图像提供给检测模型,所述检测模型被训练来处理所述特定类别的文档。
7.根据权利要求1所述的方法,其中,确定由所述边界框包围的所述文本数据是否定义键值对包括:
确定由所述边界框包围的所述文本数据包括来自预定有效键集合的键;
识别不包括所述键的由所述边界框包围的文本数据的一部分的类型;
识别与所述键相对应的值的一个或多个有效类型的集合;以及
确定不包括所述键的由所述边界框包围的所述文本数据的部分的类型被包括在与所述键相对应的值的一个或多个有效类型的所述集合中。
8.根据权利要求7所述的方法,其中,识别与所述键相对应的值的一个或多个有效类型的集合包括:
使用预定映射来将所述键映射到与所述键相对应的值的一个或多个有效类型的所述集合。
9.根据权利要求8所述的方法,其中,所述有效键集合和从键到与所述键相对应的值的有效类型的对应集合的所述映射由用户提供。
10.根据权利要求1所述的方法,其中,所述边界框具有矩形形状。
11.根据权利要求1所述的方法,进一步包括:从用户接收所述文档;以及将所述文档转换为所述图像,其中,所述图像描绘所述文档。
12.一种系统,包括:
一个或者多个计算机;以及
一个或者多个存储设备,所述一个或者多个存储设备通信地耦合到所述一个或者多个计算机,其中所述一个或者多个存储设备存储指令,所述指令当由所述一个或者多个计算机执行时,使所述一个或者多个计算机执行包括下述的操作:
向检测模型提供文档的图像,其中:
所述检测模型被配置成根据多个检测模型参数的值来处理所述图像以生成定义为所述图像生成的一个或多个边界框的输出;并且
为所述图像生成的每个边界框被预测成包围包括键文本数据和值文本数据的键值对,其中,所述键文本数据定义表征所述值文本数据的标签;以及
对于为所述图像生成的所述一个或多个边界框中的每个:
使用光学字符辨识技术来识别由所述边界框包围的文本数据;
确定由所述边界框包围的所述文本数据是否定义键值对;以及
响应于确定由所述边界框包围的所述文本数据定义键值对,提供所述键值对以用于在表征所述文档时使用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080016688.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数字内容的上下文层
- 下一篇:模具、成型系统以及模具制造方法