[发明专利]一种标注图片审核方法和装置在审
申请号: | 202010099950.X | 申请日: | 2020-02-18 |
公开(公告)号: | CN113344015A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 贾建帮 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李阳;郭晗 |
地址: | 100176 北京市北京经济技术*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 标注 图片 审核 方法 装置 | ||
本发明公开了一种标注图片审核方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:对同一图片数据的多个标注图片进行标注框数统计,以确定图片数据应标注的正确框数;根据正确框数对多个标注图片进行标注框数审核;将标注框数审核通过的每个标注图片的标注框与基准框进行位置匹配和标注文本匹配;将标注框数审核通过且各标注框位置、标注文本均匹配成功的标注图片,确定为最终审核通过的标注图片。该实施方式不依赖于审核人员主观经验和态度,避免误判、遗漏等审核错误,提高审核后标注图片的精确度,审核过程中可快速定位标注错误,对于文本行内空格和像素差异能有效判断,驳回后的数据无需标注人员去定位需要修改之处。
技术领域
本发明涉及计算机技术领域,尤其涉及一种标注图片审核方法和装置。
背景技术
自然场景文字标注(OCR Marking)是利用计算机技术通过标注框的形式标注图片中的文字信息,该技术可与身份证识别、银行卡识别,发票识别等结合,应用于人工智能系统、车辆辅助驾驶系统、智能机器人、智能视频监控、智能交通等领域。目前的自然场景文字标注采用专门审核人员检查标注结果的正确性,然后返回检查后的标注数据。现有的人工审核方式,在文本审核方面,容易出现以下问题:审核人员无法长时间集中精力验证文本的正确性,容易导致审核错误;文本较多时,虽然每行都有标号,但是审核时容易产生遗漏;对于相似文本的审核可能出现误判现象;审核时对于文本行内空格很难进行有效的判断。在标注框审核方面,容易出现以下问题:对于像素差异无法进行有效判断,只能凭借主观判断;框数较多时,无法对错框、漏框进行快速定位;当前审核方式驳回(驳回表示审核不通过)后的数据需要标注人员去定位需要修改之处。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
依赖于审核人员主观经验和态度,容易出现误判、遗漏等审核错误,审核人员在审核时无法快速定位标注错误,且难以有效判断文本行内空格和像素差异,驳回后的数据需要标注人员自己去定位需要修改之处。
发明内容
有鉴于此,本发明实施例提供一种标注图片审核方法和装置,能够不依赖于审核人员主观经验和态度,避免出现误判、遗漏等审核错误,提高审核后的标注图片的精确度,审核过程中可快速定位标注错误,对于文本行内空格和像素差异能够有效判断,驳回后的数据无需标注人员去定位需要修改之处,方便修改。
为实现上述目的,根据本发明实施例的一个方面,提供了一种标注图片审核方法。
一种标注图片审核方法,包括:对同一图片数据的多个标注图片进行标注框数统计,以确定所述图片数据应标注的正确框数;根据所述正确框数对所述多个标注图片进行标注框数审核;将标注框数审核通过的每个标注图片的标注框,与按照预设规则生成的所述图片数据的基准框进行位置匹配和标注文本匹配;将所述标注框数审核通过,且各标注框的位置、标注文本均匹配成功的标注图片,确定为最终审核通过的标注图片。
可选地,对同一图片数据的多个标注图片进行标注框数统计,以确定所述图片数据应标注的正确框数的步骤,包括:对同一图片数据的多个标注图片进行标注框数统计,以得到各标注图片的标注框数;若各标注图片的标注框数一致,则以该标注框数作为所述正确框数;若各标注图片的标注框数不一致,则选出对应标注图片数量最多的标注框数,以作为所述正确框数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司,未经北京沃东天骏信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010099950.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种网络请求的审计方法和装置
- 下一篇:模块下载方法和装置