[发明专利]基于RPA及AI的文档对比方法、装置、设备及介质在审
申请号: | 202010623590.9 | 申请日: | 2020-06-30 |
公开(公告)号: | CN111753517A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 汪冠春;胡一川;褚瑞;李玮;潘庚生;翁嘉颀 | 申请(专利权)人: | 北京来也网络科技有限公司;北京奔影网络科技有限公司 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F16/36;G06Q50/18 |
代理公司: | 北京科领智诚知识产权代理事务所(普通合伙) 11782 | 代理人: | 陈士骞 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 rpa ai 文档 对比 方法 装置 设备 介质 | ||
本发明实施例公开了一种基于RPA及AI的文档对比方法、装置、设备及介质,其中,该方法包括:S1、将不同版本的文档进行内容对比;S2、确定所述不同版本的文档出现内容差异的原因。本发明实施例的技术方案,基于RPA及AI技术,不仅实现了自动将不同版本的文档进行内容对比,还实现了对内容差异进行自动分析,从而确定出文档内容出现差异的原因,节省了工作人员分析内容差异的时间,对实际业务的进行提供了极大的便利。
技术领域
本发明涉及RPA及AI技术领域,具体涉及一种基于RPA及AI的文档对比方法、装置、设备及介质。
背景技术
RPA(Robotic process automation,机器人流程自动化),即通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。RPA具有独特的优势:低代码、非侵入。低代码是说,RPA不需要很高的IT水平就能操作,不懂编程的业务人员也能开发流程;非侵入是说,RPA可以模拟人的操作,不用软件系统开放接口。但是传统的RPA具有一定的局限性:只能基于固定的规则,并且应用场景受限。随着AI(Artificial Intelligence,人工智能)技术的不断发展,RPA与AI深度融合克服了传统RPA的局限,RPA+AI=Hand work+Head work,正在极大的改变劳动力的价值。
RPA在处理任务的过程中,可能会应用到自然语言处理(Natural LanguageProcessing,NLP)和光学字符识别(Optical Character Recognition,OCR)技术。其中,NLP是人工智能的一个子领域,可用于文本内容的理解和分类。OCR是指电子设备,例如扫描仪或数码相机,检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
目前,在利用OCR和NLP技术识别出文档内容后,市面上有产品可以实现纸质版、电子版等文档间的内容对比。文档比对可精确至标点符号、页眉页脚,并支持表格中的内容比对,生成对比结果报告。但对比结果出现内容差异对应的原因,或该差异存在的问题还需工作人员来进行进一步的分析,其人工分析过程费时费力,效率较低。
发明内容
本发明实施例公开一种基于RPA及AI的文档对比方法、装置、设备及介质,实现了自动分析不同版本的文档间的内容差异,得到出现内容差异的原因,从而提升文件的对比效率。
第一方面,本发明实施例公开了一种基于RPA及AI的文档对比方法,该方法包括:
S1、将不同版本的文档进行内容对比;
S2、确定所述不同版本的文档出现内容差异的原因。
可选的,所述方法还包括:
S3、根据所述原因生成所述内容差异对应的提示信息。
可选的,所述方法还包括:
S4、根据所述内容差异,对所述文档进行法律风险审核。
可选的,所述步骤S1具体包括:
S11、提取不同版本的文档中的关键信息;
S12、根据所述关键信息对不同版本的文档进行内容对比。
可选的,所述步骤S2具体包括:
S21、根据所述关键信息,确定所述不同版本的文档出现内容差异的原因。
可选的,所述步骤S21具体包括:
S211、从预设知识图谱中查找与所述关键信息对应的关联因子;
S212、确定所述关联因子对应的关联内容;
S213、将所述关联内容作为不同版本的文档出现内容差异的原因。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京来也网络科技有限公司;北京奔影网络科技有限公司,未经北京来也网络科技有限公司;北京奔影网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010623590.9/2.html,转载请声明来源钻瓜专利网。