[发明专利]事务分类系统在审
申请号: | 201910041521.4 | 申请日: | 2019-01-16 |
公开(公告)号: | CN110059137A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | A·亚历山大·米兰达;K·马玛斯 | 申请(专利权)人: | 埃森哲环球解决方案有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06Q10/06 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅;辛鸣 |
地址: | 爱尔兰*** | 国省代码: | 爱尔兰;IE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类数字 事务 置信度 子集 优先级排序 标签系统 标签 分类系统 类别标签 传送 关键性能指标 应用 目标系统 剩余集合 源系统 配置 申请 重复 | ||
1.一种用于处理数字事务的系统,包括:
输入/输出(I/O)接口,用于从一个或多个源系统接收未分类数字事务,并且用于向一个或多个目标系统传送分类数字事务;
处理器,其与所述I/O接口通信;以及
非暂态计算机可读介质,其与所述处理器通信,所述非暂态计算机可读介质存储指令代码,所述指令代码在由所述处理器执行时,使得所述处理器:
a)从一个或多个源系统接收多个未分类数字事务;
b)根据每个未分类数字事务的关键性能指标(KPI)来对所述未分类数字事务优先级排序;
c)向加标签系统传送经优先级排序的所述未分类数字事务的子集,所述加标签系统被配置为将类别标签应用于每个数字事务;
d)从所述加标签系统接收与经优先级排序的所述未分类数字事务的所述子集对应的分类数字事务的子集;
e)基于分类数字事务的所述子集,将类别标签和标签置信度值应用于未分类数字事务的剩余集合的每个事务,其中所述标签置信度值指示给定标签被正确地应用于给定事务的置信度;
f)针对具有等于或高于预定阈值的标签置信度值的每个分类数字事务,向目标系统传送所述分类数字事务;以及
g)针对每个剩余事务,将所述事务视为未分类数字事务,并且重复步骤(b)-(g)。
2.根据权利要求1所述的系统,其中在将类别标签和标签置信度值应用于未分类数字事务的所述剩余集合的每个事务时,所述指令代码使得所述处理器:
确定与未分类数字事务的所述剩余集合相关联的一个或多个主题;
将每个未分类数字事务集群化为属于所述一个或多个主题中的一个或多个主题;
根据由每个集群表示的总KPI来对事务的集群排序;
选择表示最高KPI的N个集群的子集;
针对所述子集的每个集群,根据所述事务的KPI来对所述集群的事务排序;
选择具有最高KPI的M个事务的子集;以及
将所述类别标签应用于M个事务的所述子集。
3.根据权利要求2所述的系统,其中由每个集群表示的所述总KPI对应于与属于所述集群的每个未分类数字事务相关联的KPI的总和。
4.根据权利要求2所述的系统,其中在确定一个或多个主题时,所述指令代码使得所述处理器:
生成与所述未分类数字事务相关联的项目的语料库;以及
通过隐含狄利克雷分配(LDA)算法来处理项目的所述语料库以确定所述一个或多个主题。
5.根据权利要求4所述的系统,其中在将每个未分类数字事务集群化为属于所述一个或多个主题中的一个或多个主题时,所述指令代码使得所述处理器:
经由基于分层密度的集群化(H-DBSCAN)将每个未分类数字事务与一个或多个集群相关联。
6.根据权利要求1所述的系统,其中在将类别标签和标签置信度值应用于未分类数字事务的剩余集合的每个事务时,所述指令代码使得所述处理器:
基于分类数字事务的所述子集来生成统计决策树;以及
通过所述决策树处理每个剩余事务以获取类别标签和与所述类别标签相关联的置信度值。
7.根据权利要求1所述的系统,其中所述未分类数字事务对应于金融发票中的行项目。
8.根据权利要求1所述的系统,其中在将类别标签和标签置信度值应用于未分类数字事务的所述剩余集合的每个事务时,所述指令代码使得所述处理器:
确定P个事务的子集在N个集群的所述子集之外;以及
选择P个事务的所述子集中具有最高KPI的Q个事务的子集。
9.根据权利要求1所述的系统,其中所述处理器被配置为基于M个事务的选择的所述子集和Q个事务的所述子集以及应用的所述类别标签来训练机器学习模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于埃森哲环球解决方案有限公司,未经埃森哲环球解决方案有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910041521.4/1.html,转载请声明来源钻瓜专利网。