[发明专利]结合RPA和AI的信息录入方法、装置、计算机设备和介质在审

专利信息
申请号: 202010825399.2 申请日: 2020-08-17
公开(公告)号: CN112182140A 公开(公告)日: 2021-01-05
发明(设计)人: 胡一川;汪冠春;褚瑞;李玮;唐梓毅 申请(专利权)人: 北京来也网络科技有限公司;北京奔影网络科技有限公司
主分类号: G06F16/31 分类号: G06F16/31;G06F16/2458;G06K9/20;G06F40/216;G06F40/289;G06K9/62
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 张大威
地址: 100080 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 结合 rpa ai 信息 录入 方法 装置 计算机 设备 介质
【权利要求书】:

1.一种结合RPA和AI的信息录入方法,其特征在于,包括:

RPA系统获取待处理合同图片的文字识别结果,其中,所述文字识别结果包括公司名称信息;

所述RPA系统对所述公司名称信息进行分词处理,以得到所述公司名称信息的分词序列;

所述RPA系统将所述分词序列中每相邻N个分词划分为一段,以得到所述公司名称信息的多段分词,其中,N为大于1的整数;

所述RPA系统基于预设的倒排索引库,对每段分词进行检索,以得到每段分词的第一候选公司名称词条集合,其中,所述第一候选公司名称词条集合包括多个第一候选公司名称词条,所述第一候选公司名称词条与对应段分词至少有两个分词匹配;

所述RPA系统根据多个所述第一候选公司名称词条,获取与所述公司名称信息文本相似度最高的目标公司名称信息;

所述RPA系统根据所述目标公司名称信息和与所述目标公司名称信息对应的公司地址信息,对所述待处理合同图片对应的合同信息录入表进行自动信息录入。

2.根据权利要求1所述的方法,其特征在于,所述RPA系统根据多个所述第一候选公司名称词条,获取与所述公司名称信息文本相似度最高的目标公司名称信息,包括:

所述RPA系统根据每段分词的多个所述第一候选公司名称词条,确定所述公司名称信息的第二候选公司名称词条集合,其中,所述第二候选公司名称词条包括至少一个第二候选公司名称词条,所述第二候选公司名称词条与所述分词序列相匹配的分词数量最多;

所述RPA系统根据所述公司名称信息与每个所述第二候选公司名称词条之间的文本相似度,获取文本相似度最高的第二候选公司名称词条作为所述目标公司名称信息。

3.根据权利要求1所述的方法,其特征在于,所述RPA系统对所述公司名称信息进行分词处理,以得到所述公司名称信息的分词序列,包括:

所述RPA系统对所述公司名称信息进行单字分词处理,以得到所述公司名称信息的单字序列;

所述RPA系统对所述公司名称信息进行词语分词处理,以得到所述公司序列的词维度序列;

所述RPA系统获取所述词维度序列中的每个词组;

所述RPA系统针对每个所述词组,将所述单字序列中与所述词组对应的单字删除,以得到处理后的单字序列;

所述RPA系统根据所述词组和所述处理后的单字序列,生成所述公司名称信息的分词序列。

4.根据权利要求2所述的方法,其特征在于,所述RPA系统根据每段分词的多个所述第一候选公司名称词条,确定所述公司名称信息的第二候选公司名称词条集合,包括:

所述RPA系统根据每段分词的多个所述第一候选公司名称词条,获取每个所述第一候选公司名称词条与所述分词序列中分词相匹配的分词数量;

所述RPA系统从多个所述第一候选公司名称词条中,选择分词数量满足预设条件的第一候选公司名称词条,以生成所述公司名称信息的第二候选公司名称词条。

5.根据权利要求2所述的方法,其特征在于,所述RPA系统根据所述公司名称信息与每个所述第二候选公司名称词条之间的文本相似度,获取文本相似度最高的第二候选公司名称词条作为所述目标公司名称信息,包括:

所述RPA系统针对每个所述第二候选公司名称词条,确定所述公司名称信息与所述第二候选公司名称词条之间的最小编辑距离;

所述RPA系统从多个所述第二候选公司名称词条中,选择所述最小编辑距离最小的第二候选公司名称词条作为所述目标公司名称信息。

6.根据权利要求4所述的方法,其特征在于,所述RPA系统从多个所述第一候选公司名称词条中,选择分词数量满足预设条件的第一候选公司名称词条,以生成所述公司名称信息的第二候选公司名称词条,包括:

所述RPA系统按照所述分词数量从大到小的顺序,对多个所述第一候选公司名称词条进行排序,以得到排序结果;

所述RPA系统从所述排序结果中选择排序在前的M个第一候选分词名称信息,以生成所述公司名称信息的第二候选公司名称词条,其中,M为大于或者等于1的整数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京来也网络科技有限公司;北京奔影网络科技有限公司,未经北京来也网络科技有限公司;北京奔影网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010825399.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top