[发明专利]基于AI和RPA的文件标注方法、装置、设备和介质在审
申请号: | 202111021971.0 | 申请日: | 2021-09-01 |
公开(公告)号: | CN113836090A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 杨子杰;汪冠春;胡一川;褚瑞;李玮 | 申请(专利权)人: | 北京来也网络科技有限公司;来也科技(北京)有限公司 |
主分类号: | G06F16/16 | 分类号: | G06F16/16;G06F16/17;G06K9/32 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 罗岚 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ai rpa 文件 标注 方法 装置 设备 介质 | ||
本公开提出一种基于AI和RPA的文件标注方法、装置、设备和介质,涉及AI和RPA领域,其中,方法包括:RPA系统获取文件标注请求;RPA系统响应于文件标注请求,生成与文件标注请求对应的响应结果;RPA系统根据所述响应结果,绘制待标注文件对应的目标图片;RPA系统响应于鼠标事件,确定目标图片中的文本标注的区域范围;RPA系统根据对待标注文件进行光学字符识别OCR所获取的第一文本信息和第一文本信息的各个文本片段对应的位置信息,确定区域范围内的文本标注结果。由此,可实现图片中文本信息的提取以及文本中不连续文字的选择,同时可获取到标注的区域范围内的文本信息以及文本信息中文本片段的位置信息,可满足模型训练的需求。
技术领域
本公开涉及人工智能(Artificial Intelligence,简称AI)和机器人流程自动化(Robotic Process Automation,简称RPA)领域,尤其涉及一种基于AI和RPA的文件标注方法、装置、设备和介质。
背景技术
RPA是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
AI是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。
随着RPA的普及,越来越多的企业使用RPA帮助员工完成重复的劳动,但是在模型的训练过程中,依然需要大量的人工对文件进行标注,以获取训练数据。比如,通过大量的人工标注PDF文件或图片获取训练数据,对文档结构信息和视觉信息进行建模,如,通用文档预训练模型LayoutLM,让模型在预训练阶段进行多模态对齐。
然而上述的文件标注方式,无法选择不连续的文字和提取图片上的文字,不包含文字在文档中的位置信息,无法满足模型训练的需求。
发明内容
本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本公开提出一种基于AI和RPA的文件标注方法、装置、设备和介质,以实现RPA系统通过确定目标图片中的文本标注区域范围,以及区域范围内的文本标注结果,实现了图片中文本信息的提取以及文本中不连续文字的选择,同时可获取到标注的区域范围内的文本信息以及文本信息中文本片段的位置信息,可满足模型训练的需求。
本公开第一方面实施例提出了一种基于AI和RPA的文件标注方法,包括:RPA系统获取文件标注请求;其中,所述文件标注请求用于对待标注文件进行标注;所述RPA系统响应于所述文件标注请求,生成与所述文件标注请求对应的响应结果;所述RPA系统根据所述响应结果,绘制所述待标注文件对应的目标图片;所述RPA系统响应于鼠标事件,确定所述目标图片中的文本标注的区域范围;所述RPA系统根据对所述待标注文件进行光学字符识别OCR所获取的第一文本信息和所述第一文本信息的各个文本片段对应的位置信息,确定所述区域范围内的文本标注结果。
本公开第二方面实施例提出了一种基于AI和RPA的文件标注装置,所述文件标注装置应用与RPA系统,包括:获取模块,用于获取文件标注请求;其中,所述文件标注请求用于对待标注文件进行标注;生成模块,用于响应于所述文件标注请求,生成与所述文件标注请求对应的响应结果;绘制模块,用于根据所述响应结果,绘制所述待标注文件对应的目标图片;第一确定模块,用于响应于鼠标事件,确定所述目标图片中的文本标注的区域范围;第二确定模块,用于根据对所述待标注文件进行光学字符识别OCR所获取的第一文本信息和所述第一文本信息的各个文本片段对应的位置信息,确定所述区域范围内的文本标注结果。
本公开第三方面实施例提出了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如本公开上述第一方面实施例所述的方法。
本公开第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如本公开上述第一方面实施例所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京来也网络科技有限公司;来也科技(北京)有限公司,未经北京来也网络科技有限公司;来也科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111021971.0/2.html,转载请声明来源钻瓜专利网。