[发明专利]用于文档处理的位置嵌入在审

申请号：	202010965171.3	申请日：	2020-09-15
公开（公告）号：	CN112825129A	公开（公告）日：	2021-05-21
发明（设计）人：	C.雷斯威格;S.K.鲍尔	申请（专利权）人：	SAP欧洲公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/20;G06N3/04;G06N3/08
代理公司：	北京市柳沈律师事务所 11105	代理人：	邵亚丽
地址：	德国瓦***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于文档处理位置嵌入
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本文公开了使用位置嵌入来生成文档标签的系统、方法和计算机程序产品实施例。在实施例中，标签系统可以识别文档图像的标记，诸如词语。该标签系统可以将位置向量神经网络应用于该文档图像，以分析像素并确定对应于词语的位置嵌入向量。该标签系统然后可以将该位置嵌入向量与相应的词向量组合，以用作训练为生成文档标签的神经网络的输入。这种组合可以以串行化的方式将该位置信息嵌入相应的词语信息，以供文档标签神经网络处理。使用这种格式化，该标签系统可以以轻量且快速的方式生成文档标签，同时仍然保留词语之间的空间关系。

技术领域

本公开的实施例涉及用于文档处理的系统、方法以及非暂时性计算机可读设备。

背景技术

光学字符识别(optical character recognition，OCR)已经用于识别文档中的字符。此外，已经开发了机器学习算法，以基于应用的OCR技术来识别文档图像中的字符和词语。例如，可以从文档图像中提取字符、词语或符号。然而，这些技术可能不会保留与符号相关的位置信息。例如，这些技术可以不考虑文档符号的布局。这种位置信息的缺少可能给分析文档的内容带来困难。如果在文档处理期间不考虑该位置信息，即使包括文本和位置信息的文档数据文件也可能产生不准确和/或不正确的结果。

发明内容

本公开的至少一实施例提供一种计算机实现的方法。该方法可以包括：接收文档图像；识别所述文档图像的一个或多个标记(token)；将第一神经网络应用于文档图像，以识别对应于所述一个或多个标记的位置嵌入序列；将第二神经网络应用于所述一个或多个标记与位置嵌入序列的相应位置嵌入的一个或多个组合；以及响应于应用第二神经网络，生成一个或多个文档标签。

本公开的至少一实施例还提供一种系统。该系统可以包括存储器和至少一个处理器。所述至少一个处理器耦合到存储器并且可以被配置为：接收文档图像；识别文档图像的一个或多个标记；将第一神经网络应用于文档图像，以识别对应于所述一个或多个标记的位置嵌入序列；将第二神经网络应用于所述一个或多个标记与位置嵌入序列的相应位置嵌入的一个或多个组合；以及响应于应用第二神经网络，生成一个或多个文档标签。

本公开的至少一实施例还提供一种非暂时性计算机可读设备。该非暂时性计算机可读设备具有存储在其上的指令，该指令当由至少一个计算设备执行时可以使得所述至少一个计算设备执行操作，该操作可以包括：接收文档图像；识别文档图像的一个或多个标记；将第一神经网络应用于文档图像，以识别对应于所述一个或多个标记的位置嵌入序列；将第二神经网络应用于所述一个或多个标记与位置嵌入序列的相应位置嵌入的一个或多个组合；以及响应于应用第二神经网络，生成一个或多个文档标签。

附图说明

附图结合于此并构成说明书的部分。

图1A描绘了根据一些实施例的文档处理环境的框图。

图1B描绘了根据一些实施例的文档处理流程的框图。

图2描绘了根据一些实施例的示例网络方程。

图3描绘了示出根据一些实施例的用于生成文档标签的方法的流程图。

图4描绘了根据一些实施例的示例串行化技术。

图5描绘了有助于实现各种实施例的示例计算机系统。

在附图中，相同的附图标记通常指示相同或相似的元件。此外，通常附图标记的(多个)最左边的位标识其中该附图标记首次出现的附图。

具体实施方式

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载