[发明专利]用于机器人流程自动化的文档处理框架在审
申请号: | 202080002358.1 | 申请日: | 2020-08-28 |
公开(公告)号: | CN112771514A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | I·吉利冈;P·帕拉奥 | 申请(专利权)人: | 尤帕斯公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/338;G06K9/32;G06K9/62 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 黄倩 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 机器人 流程 自动化 文档 处理 框架 | ||
提供了一种用于机器人流程自动化(RPA)的文档处理框架(DPF)。DPF可以允许不同供应者产品在同一平台上的即插即用的使用,用户可以在平台中设置用于文档处理和文档理解工作流的基本方案。DPF可以允许用户定义分类法、使文件数字化、将文件分类成一个或多个文档类型、验证分类、提取数据、验证所提取的数据、训练分类器和/或训练提取器。可以提供公共包,软件开发者可以使用公共包来管理DPF并且构建其自身的分类器和提取器组件。
本申请要求于2019年9月30日提交的美国非临时专利申请第16/587,386号的权益。该早前提交的申请的主题以其整体内容通过引用并入于此。
技术领域
本发明大体上涉及机器人流程自动化(RPA),且更具体地涉及一种用于RPA的文档处理框架(DPF)。
背景技术
大多数商用电子文档处理工具在单个平台上执行文档处理。此外,文档处理领域中的大多数供应者提供了黑匣子解决方案,在该解决方案中,组件不能够与第三方提供者互换。由于该限制,所以想要使用多于一个的供应者的客户需要设置两个或更多个并行集成,训练员工使用两个或更多个不同工具,并且提供相应用户接口以供执行这些职责。该问题存在于旨在集成多个用于文档处理的技术的解决方案中,并且不一定是RPA特定的。实际上,对于每个供应者都需要单独的工作流。
而且,想要使用其自身的定制文档处理算法的用户需要自行构建整个基础设施,以使其在端到端过程中为集成的且可用的。这样的文档处理算法包括但不限于:使用多个OCR供应者来处理数字化;处理来自不同供应者的文档处理算法的不同解决方案、集成和配置间的分类法映射;以统一数据格式聚合来自多个供应者的结果等。鉴于上文,一种改进的文档处理框架解决方案可以是有益的。
发明内容
本发明的某些实施例可以提供对本领域中尚未经当前的基于计算机的文档处理技术完全标识、了解或者解决的问题和需求的解决方案。例如,本发明的一些实施例涉及一种用于RPA的DPF。
在实施例中,一种计算机程序被实施在非瞬态计算机可读介质上。该程序被配置为使至少一个处理器:使用RPA工作流中的一个或多个分类器将文件自动分类成一个或多个文档类型;以及将自动分类的结果存储在分类数据结构中。该程序还被配置为使至少一个处理器:使用RPA工作流中的一个或多个提取器从经分类的文件自动提取数据;以及将自动提取的数据存储在提取数据结构中。该程序还被配置为使至少一个处理器输出自动提取的数据。
在另一实施例中,一种计算机实现的方法包括:由计算系统从分类法管理器接收所定义的文档类型的列表和针对所定义的文档类型中的每一个所定义的文档类型的相关联字段;以及由计算系统将文档类型的列表和相关联字段存储在主分类法数据结构中。该计算机实现的方法还包括:由计算系统使用RPA工作流中的一个或多个分类器将文件自动分类成一个或多个文档类型;以及由计算系统将自动分类的结果存储在分类数据结构中。该计算机实现的方法还包括:由计算系统输出自动分类的结果。
在又一实施例中,一种系统包括:存储器,该存储器存储计算机程序指令;以及至少一个处理器,该至少一个处理器被配置为执行计算机程序指令。该指令被配置为使至少一个处理器:从分类法管理器接收所定义的文档类型的列表和针对所定义的文档类型中的每一个所定义的文档类型的相关联字段。该指令还被配置为使至少一个处理器执行RPA工作流中的数字化活动,并且输出文件的文本版本和文档对象模型(DOM)。该指令还被配置为使至少一个处理器:使用RPA工作流中的一个或多个分类器将文件自动分类成一个或多个文档类型;以及使用RPA工作流中的一个或多个提取器从经分类的文档自动提取数据。附加地,该指令还被配置为使至少一个处理器输出自动提取的数据。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于尤帕斯公司,未经尤帕斯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080002358.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:木柱连结构造及木柱设置构造
- 下一篇:接收装置