[发明专利]用于文档处理的位置嵌入在审
申请号: | 202010965171.3 | 申请日: | 2020-09-15 |
公开(公告)号: | CN112825129A | 公开(公告)日: | 2021-05-21 |
发明(设计)人: | C.雷斯威格;S.K.鲍尔 | 申请(专利权)人: | SAP欧洲公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06N3/04;G06N3/08 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 德国瓦*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 文档 处理 位置 嵌入 | ||
1.一种计算机实现的方法,包括:
接收文档图像;
识别所述文档图像的一个或多个标记;
将第一神经网络应用于所述文档图像,以识别对应于所述一个或多个标记的位置嵌入序列;
将第二神经网络应用于所述一个或多个标记与所述位置嵌入序列的相应位置嵌入的一个或多个组合;以及
响应于应用所述第二神经网络,生成一个或多个文档标签。
2.根据权利要求1所述的计算机实现的方法,其中所述一个或多个标记是所述文档图像的词语。
3.根据权利要求1所述的计算机实现的方法,其中所述位置嵌入序列是对应于所述一个或多个标记的向量。
4.根据权利要求1所述的计算机实现的方法,其中应用所述第一神经网络还包括:
应用空间填充曲线来串行化位置向量,以识别所述位置嵌入序列。
5.根据权利要求1所述的计算机实现的方法,其中所述一个或多个组合是通过将位置嵌入附加到所述一个或多个标记中的相应标记来生成的。
6.根据权利要求1所述的计算机实现的方法,其中所述一个或多个组合以一维序列排列,以用于由所述第二神经网络进行分析。
7.根据权利要求1所述的计算机实现的方法,其中所述第一神经网络和所述第二神经网络是单个神经网络的子网络。
8.一种系统,包括:
存储器;和
至少一个处理器,耦合到所述存储器并被配置为:
接收文档图像;
识别所述文档图像的一个或多个标记;
将第一神经网络应用于所述文档图像,以识别对应于所述一个或多个标记的位置嵌入序列;
将第二神经网络应用于所述一个或多个标记与所述位置嵌入序列的相应位置嵌入的一个或多个组合;以及
响应于应用所述第二神经网络,生成一个或多个文档标签。
9.根据权利要求8所述的系统,其中所述一个或多个标记是所述文档图像的词语。
10.根据权利要求8所述的系统,其中所述位置嵌入序列是对应于所述一个或多个标记的向量。
11.根据权利要求8所述的系统,其中为了应用所述第一神经网络,所述至少一个处理器还被配置为:
应用空间填充曲线来串行化位置向量,以识别所述位置嵌入序列。
12.根据权利要求8所述的系统,其中所述一个或多个组合是通过将位置嵌入附加到所述一个或多个标记中的相应标记来生成的。
13.根据权利要求8所述的系统,其中所述一个或多个组合以一维序列排列,以用于由所述第二神经网络进行分析。
14.根据权利要求8所述的系统,其中所述第一神经网络和所述第二神经网络是单个神经网络的子网络。
15.一种非暂时性计算机可读设备,具有存储在其上的指令,所述指令当由至少一个计算设备执行时使得所述至少一个计算设备执行操作,所述操作包括:
接收文档图像;
识别所述文档图像的一个或多个标记;
将第一神经网络应用于所述文档图像,以识别对应于所述一个或多个标记的位置嵌入序列;
将第二神经网络应用于所述一个或多个标记与所述位置嵌入序列的相应位置嵌入的一个或多个组合;以及
响应于应用所述第二神经网络,生成一个或多个文档标签。
16.根据权利要求15所述的非暂时性计算机可读设备,其中所述一个或多个标记是所述文档图像的词语。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于SAP欧洲公司,未经SAP欧洲公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010965171.3/1.html,转载请声明来源钻瓜专利网。