[发明专利]基于RPA的网页内嵌文档的处理方法及装置在审
申请号: | 202211179159.5 | 申请日: | 2022-09-27 |
公开(公告)号: | CN115688679A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 曹艺莹;郭孟扬;郭旗;李春霞 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F40/12 | 分类号: | G06F40/12;G06F8/38;G06F16/957 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 赵秀峰;任默闻 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 rpa 网页 文档 处理 方法 装置 | ||
本发明可用于机器人流程自动化技术在金融方面应用的技术领域,本发明提供了一种基于RPA的网页内嵌文档的处理方法及装置,对应的方法包括:获取内嵌有文档的网页表单数据;解析所述网页表单数据,以生成具有Json数组格式的网页表单数据;根据所述具有Json数组格式的网页表单数据处理所述网页表单数据的内嵌文档。本发明所提供的基于RPA的网页内嵌文档的处理方法及装置,通过运用JavaScript技术弥补了RPA机器人在网页内嵌文档自动化填写方面的不足,将业务人员从单一重复的复制、粘贴、在线文档编辑工作中解放出来,不仅减轻了重复劳动工作量,还提高了业务处理效率和数据录入的准确性。
技术领域
本申请属于机器人流程自动化技术领域,特别是涉及机器人流程自动化中对于网页内嵌office文档的自动化处理的技术领域,具体涉及一种基于RPA的网页内嵌文档的处理方法及装置。
背景技术
机器人流程自动化技术(Robotic Process Automation,RPA)是通过运用应用软件对外提供的接口、win32句柄、网页元素属性,并结合鼠标点击以及键盘输入等操作,模拟用户与计算机间的交互,从而实现业务流程自动化处理。RPA因其采用非侵入式方式实现异构系统之间的流程联动,不会破坏原有IT结构的优势,被广泛应用于数据迁移与录入场景中,如金融系统A与金融系统B之间的数据迁移与录入等。
现有技术中,对于网页内容的采集与录入,RPA一般是通过根据HTML标签元素的属性或索引定位元素位置来实现的。但很多现有系统如电子签约系统等,因合同模板经常随政策或者其他原因发生变动,不再使用文本、表格、表单等常见的网页元素展示信息,而是通过在网页中内嵌office文档的形式进行信息展示。对于这种网页内嵌office文档的自动化填写的应用场景,RPA机器人无法提供很好地支持,其无法通过HTML标签元素的属性或索引来快捷地定位文档中某个内容的具体位置,此时需借助OCR等手段定位文档位置,再进行内容填写,过程比较繁琐,对技术人员要求也比较高。
发明内容
本发明可用于机器人流程自动化技术在金融方面应用的技术领域,也可用于除金融领域之外的任意领域,本发明无需借助OCR技术就可完成网页内嵌office文档的自动录入,方便快捷且技术友好,特别的,可将其与RPA技术结合,然后应用于拓展RPA机器人在异构系统间数据迁移与录入的应用场景中。
第一方面,本发明提供一种基于RPA的网页内嵌文档的处理方法,该方法包括:
获取内嵌有文档的网页表单数据;
解析所述网页表单数据,以生成具有Json数组格式的网页表单数据;
根据所述具有Json数组格式的网页表单数据处理所述网页表单数据的内嵌文档。
一实施例中,所述获取内嵌有文档的网页表单数据包括:
根据网页标签索引串及/或网页标签属性获取网页中目标元素名称所对应的属性值。
一实施例中,在所述根据网页标签索引串及/或网页标签属性获取网页中目标元素名称所对应的属性值之前,还包括:
根据客户编码生成查询条件;
根据查询条件获取目标元素名称。
一实施例中,所述解析所述网页表单数据,以生成具有Json数组格式的网页表单数据,包括:
根据目标元素名称生成key值;
根据所述属性值生成value值;
根据所述key值以及其对应的value值生成键值对;
根据多个键值对生成所述具有Json数组格式的网页表单数据。
一实施例中,根据所述具有Json数组格式的网页表单数据处理所述网页表单数据的内嵌文档,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211179159.5/2.html,转载请声明来源钻瓜专利网。