[发明专利]标注方法及装置和系统、电子设备和存储介质在审
申请号: | 201910175547.8 | 申请日: | 2019-03-08 |
公开(公告)号: | CN111666936A | 公开(公告)日: | 2020-09-15 |
发明(设计)人: | 郑迪昕;刘学博 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标注 方法 装置 系统 电子设备 存储 介质 | ||
本公开涉及一种标注方法及装置和系统、电子设备和存储介质,方法包括:获取第一样本图像和第一样本图像的处理结果,其中,处理结果是基于图像处理网络对第一样本图像进行处理得到的;显示第一样本图像的处理结果;获取对第一样本图像的处理结果的调整结果,并基于调整结果得到第一样本图像的标注结果。本公开实施例可减少标注人员的标注操作,有效提高标注效率。
技术领域
本公开涉及计算机技术领域,尤其涉及一种标注方法及装置和系统、电子设备和存储介质。
背景技术
随着深度学习的发展,在OCR(Optical Character Recognition,光学字符识别)等各种深度学习网络模型更新的过程中,需要大量的标注数据支撑。相关技术中,标注人员采用标注系统对数据进行标注时,需要标注的数据量过大,目前的数据少则几万张图片,多则上百万张图片,一份数据从筛选到标注完成往往需要历时1—2个月,这就使得标注过程缓慢,影响了深度学习网络模型的更新效率。
发明内容
本公开提出了一种标注方法及装置和系统、电子设备和存储介质,可以以处理结果的方式辅助标注人员进行数据标注,从而减少了标注人员的标注操作,有效提高了标注效率。
根据本公开一方面,提供了一种样本图像标注方法,包括:
获取第一样本图像和所述第一样本图像的处理结果,其中,所述处理结果是基于图像处理网络对所述第一样本图像进行处理得到的;
显示所述第一样本图像的处理结果;
获取对所述第一样本图像的处理结果的调整结果,并基于所述调整结果得到所述第一样本图像的标注结果。
在一种可能的实现方式中,所述图像处理网络对所述第一样本图像进行处理得到输出结果,所述处理结果是通过对所述图像处理网络输出的输出结果进行格式转换得到的。
在一种可能的实现方式中,所述获取所述第一样本图像的处理结果,包括:
调用所述图像处理网络对所述第一样本图像进行处理得到输出结果,并将所述输出结果作为所述处理结果。
在一种可能的实现方式中,所述处理结果包括下列中的至少一种:所述第一样本图像的名称信息、所述第一样本图像的存储路径信息、所述处理结果的版本信息、所述第一样本图像的识别结果信息、以及在所述第一样本图像中包含的检测框的位置信息。
在一种可能的实现方式中,所述处理结果的格式为json格式。
在一种可能的实现方式中,所述获取对所述第一样本图像的处理结果的调整结果,包括:
接收用户输入的结果调整指令,并基于所述结果调整指令对所述处理结果进行调整,得到所述调整结果。
在一种可能的实现方式中,所述第一样本图像的处理结果以所述第一样本图像的md5值命名;
其中,所述获取第一样本图像和所述第一样本图像的处理结果,包括:
接收样本图像集和处理结果集,其中,所述样本图像集具有包括所述第一样本图像在内的至少一个样本图像,所述处理结果集包括所述至少一个样本图像中每个样本图像的处理结果;
根据所述第一样本图像的md5值,从所述处理结果集中提取出所述第一样本图像的处理结果。
在一种可能的实现方式中,还包括:
基于工作流文件中包含的脚本调用信息,调用至少一个数据处理脚本处理所述标注结果,生成用于深度学习网络的训练数据。
根据本公开的另一方面,还提供了一种样本图像标注装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910175547.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电车储能系统
- 下一篇:餐桌占用情况的显示方法及装置