[发明专利]用于机器人流程自动化的文档处理框架在审
申请号: | 202080002358.1 | 申请日: | 2020-08-28 |
公开(公告)号: | CN112771514A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | I·吉利冈;P·帕拉奥 | 申请(专利权)人: | 尤帕斯公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/338;G06K9/32;G06K9/62 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 黄倩 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 机器人 流程 自动化 文档 处理 框架 | ||
1.一种被实施在非瞬态计算机可读介质上的计算机程序,所述程序被配置为使至少一个处理器:
使用机器人流程自动化(RPA)工作流中的一个或多个分类器将文件自动分类成一个或多个文档类型;
将所述自动分类的结果存储在分类数据结构中;
使用所述RPA工作流中的一个或多个提取器从经分类的所述文件自动提取数据;
将自动提取的所述数据存储在提取数据结构中;以及
输出自动提取的所述数据。
2.根据权利要求1所述的计算机程序,其中所述一个或多个分类器被配置为执行基于布局的分类、基于情绪的分类、基于特征的分类、基于自然语言处理(NLP)的分类、基于机器学习(ML)的分类、基于深度学习的分类、基于图像的分类、基于关键字的分类、基于颜色的分类、或者上述的任何组合。
3.根据权利要求1所述的计算机程序,其中所述自动分类包括:基于针对所述一个或多个分类器中的每个分类器的最小置信度阈值来使用接受标准。
4.根据权利要求1所述的计算机程序,其中所述自动分类包括:映射所述一个或多个分类器中的相应分类器的所述主分类法和内部分类法。
5.根据权利要求1所述的计算机程序,其中所述程序还被配置为使所述至少一个处理器:
基于所述RPA工作流中的分类器顺序对来自每个分类器的结果进行优先级排序;基于所述文档类型来选择用于所述自动分类中的所述一个或多个分类器中的分类器;向所述一个或多个分类器中的至少一个分类器指派最小置信度阈值;或者上述的任何组合。
6.根据权利要求1所述的计算机程序,其中所述程序还被配置为使所述至少一个处理器:
执行分类验证模块,所述分类验证模块提供接口,以审阅、校正和/或手动地处理用于所述自动分类的文件。
7.根据权利要求1所述的计算机程序,其中所述一个或多个提取器被配置为执行基于模板的提取、基于布局的提取、基于关键字的提取、基于正则表达的提取、基于上下文的提取、基于标签/锚的提取、基于图案的提取、基于自然语言处理的提取、机器学习提取、深度学习提取、基于元数据的提取、或者上述的任何组合。
8.根据权利要求1所述的计算机程序,其中所述自动数据提取包括:基于针对所述一个或多个提取器中的每个提取器的最小置信度阈值来使用接受标准。
9.根据权利要求1所述的计算机程序,其中所述自动数据提取包括:映射所述一个或多个提取器中的相应提取器的所述主分类法和内部分类法。
10.根据权利要求1所述的计算机程序,其中所述程序还被配置为使所述至少一个处理器:
基于所述RPA工作流中的提取器顺序对来自每个提取器的结果进行优先级排序;基于所述文档类型来选择用于所述自动提取中的所述一个或多个提取器中的提取器;向所述一个或多个提取器中的至少一个提取器指派最小置信度阈值;或者上述的任何组合。
11.根据权利要求1所述的计算机程序,其中所述程序还被配置为使所述至少一个处理器:
执行数据提取验证模块,所述数据提取验证模块提供接口,以校正和/或手动地处理来自所述自动提取的数据点。
12.根据权利要求1所述的计算机程序,其中所述程序还被配置为使所述至少一个处理器:
执行提取器训练模块,所述提取器训练模块支持针对所述一个或多个提取器的反馈回路的完成。
13.根据权利要求1所述的计算机程序,其中所述程序被配置为使所述至少一个处理器:
执行分类器训练模块,所述分类器训练模块支持针对所述一个或多个分类器的反馈回路的完成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于尤帕斯公司,未经尤帕斯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080002358.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:木柱连结构造及木柱设置构造
- 下一篇:接收装置