[发明专利]RPA系统中基于自然语言处理的流程差错控制方法和系统在审
申请号: | 202110622293.7 | 申请日: | 2021-06-04 |
公开(公告)号: | CN113360649A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 蔡宇辉;李肯立;刘双翼;杨圣洪;秦云川;吴帆 | 申请(专利权)人: | 湖南大学;中电金信软件有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/247;G06F40/284;G06F40/30 |
代理公司: | 武汉臻诚专利代理事务所(普通合伙) 42233 | 代理人: | 宋业斌 |
地址: | 410082 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | rpa 系统 基于 自然语言 处理 流程 差错 控制 方法 | ||
1.一种RPA系统中基于自然语言处理的流程差错控制方法,其特征在于,包括如下步骤:
(1)获取RPA流程信息;
(2)将步骤(1)获得的RPA流程信息输入训练好的RPA流程差错检测模型,以得到RPA流程差错信息列表。
(3)根据步骤(2)得到的RPA流程差错信息列表执行流程差错控制。
2.根据权利要求1所述的RPA系统中基于自然语言处理的流程差错控制方法,其特征在于,
RPA流程差错检测模型是双向长短时记忆网络BiLSTM、卷积神经网络CNN、或Transformer类预训练模型;
当RPA流程差错检测模型采用Transformer类预训练模型时,其包括electra-small模型和Chinese-electra-small模型。
3.根据权利要求2所述的RPA系统中基于自然语言处理的流程差错控制方法,其特征在于,步骤(2)中的RPA流程差错检测模型是通过以下步骤训练得到的:
(2-1)获取RPA系统中的活动场景、及其对应的文本,对文本先后进行筛选、分类和整合处理,以得到文本语料库,其中文本分为正常信息文本和差错信息文本;
(2-2)对步骤(2-1)得到的文本语料库进行预处理和标注处理,以得到RPA标注语料库;
(2-3)对步骤(2-2)得到的RPA标注语料库先后进行数据增强和数据扩充处理,以得到RPA专用语料库;
(2-4)将步骤(2-3)得到的RPA专用语料库划分为训练集、验证集以及测试集;
(2-5)将步骤(2-4)得到的训练集和验证集输入RPA流程差错检测模型进行迭代训练,直至RPA流程差错检测模型收敛为止,并利用步骤(2-4)得到的测试集对RPA流程差错检测模型进行验证处理,直到得到RPA流程差错检测模型的检测精度达到最优为止,从而得到训练好的RPA流程差错检测模型。
4.根据权利要求3所述的RPA系统中基于自然语言处理的流程差错控制方法,其特征在于,
步骤(2-1)首先是获取RPA系统中的活动场景、及其对应的文本,然后将这些文本进行筛选、分类和整合处理,以得到文本语料库。
正常信息文本指的是其机器情感偏向是机器情感正向或机器情感中性的文本;
差错信息文本指的是其机器情感偏向是机器情感负向的文本。
5.根据权利要求3所述的RPA系统中基于自然语言处理的流程差错控制方法,其特征在于,步骤(2-2)首先是使用正则表达式对文本语料库中的每个待标注文本进行数据清洗,以去除特殊符号;然后使用自然语言处理工具包NLTK对去除了特殊符号后的每个待标注文本进行处理,以去除其中的停用词并修正其中的单词表示;最后对处理后的待标注文本进行分类标注,所有分类标注后得到的文本构成RPA标注语料库;其中在分类标注过程中,是将正常信息文本标注为1,将差错信息文本标注为0。
6.根据权利要求3所述的RPA系统中基于自然语言处理的流程差错控制方法,其特征在于,步骤(2-3)包括以下子步骤:
(2-3-1)对步骤(2-2)得到的RPA标注语料库中的每个文本进行近义词扩充处理,所有扩充处理后的文本构成第一语料库;
(2-3-2)将步骤(2-3-1)得到的第一语料库进行数据复制处理,以得到第二语料库;
(2-3-3)将步骤(2-3-2)得到的第二语料库中的每个差错信息文本进行反义词扩展处理,以得到第三语料库;
(2-3-4)对步骤(2-3-3)得到的第三语料库中的差错信息文本进行机器情感调和处理,以得到RPA专用语料库;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学;中电金信软件有限公司,未经湖南大学;中电金信软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110622293.7/1.html,转载请声明来源钻瓜专利网。