[发明专利]一种图像分类数据标注质量评估方法在审
申请号: | 201910239565.8 | 申请日: | 2019-03-27 |
公开(公告)号: | CN111652258A | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 熊杰成 | 申请(专利权)人: | 上海铼锶信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 上海恒锐佳知识产权代理事务所(普通合伙) 31286 | 代理人: | 黄海霞 |
地址: | 201615 上海市松江区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 分类 数据 标注 质量 评估 方法 | ||
本发明涉及图像识别领域,提出了一种图像分类数据标注质量评估方法,包括:提供图像数据集,所述图像数据集包括图像及对每幅图像进行人工标注后得到的分类数据;图像特征提取,基于图像HSV通道提取每一幅图像中描述图像颜色的多个特征向量,以及基于图像的局部特征提取每一幅图像中用于描述图像外观的多个特征向量;特征离散程度度量,利用统计量分析,对所述颜色和/或外观特征向量的离散程度进行建模;自动化评分,基于建模得到的离散程度模型对所述图像进行打分排序,并以排序结果对所述分类数据进行评估。通过本发明可以实现自动化的数据标注质量评估,提供量化依据用以辅助人工评估从而降低时间成本。
技术领域
本发明涉及图像识别技术领域,尤其涉及一种图像分类数据标注质量评估方法。
背景技术
图像分类数据标注质量的评估可定义为对人为标注后的数据存在的语义误差进行估计的问题。在一个图像分类应用需求的实现过程中,对于训练数据集的标注是一个非常重要的环节,一般需要在大量的人工帮助下进行完成。然而,人工标注后的数据由于人为误差的存在以及原始数据源本身的问题等,不可避免的会导致数据标注的质量问题,进而对后续基于标注数据而进行的模型训练造成影响。因此对于图像分类数据的标注质量评估,进而针对性的对于标注质量比较差的数据进行处理是非常有必要的。
但由于数据量的巨大,以人工完成标注质量评估的方式的时间成本过高,因此研发对图像分类数据标注质量进行自动化评估的系统,用以辅助人工审核节省时间成本是非常有意义的。
另一方面,现有技术更关注图像本身的质量。比如在中国专利申请:CN201710044621中,揭露了一种图像质量的评估方法,旨在解决更接近人眼视觉评估效果的图像质量评估问题。
通常图像数据质量的评估,相关的评估标准包括:
(1)准确性:对对象属性的描述是否正确。
(2)合规性:存储格式是否标准。
(3)一致性:数据值是否冲突。
(4)重复性:数据的记录是否重复。
(5)及时性:关键数据是否及时传送到目标应用。
(6)完备性:检验数据是否根本就不存在。
从数据质量评估的标准以及数据标注质量评估的定义,可以了解到数据质量评估可以作为数据标注质量评估的一个前提,其更多的是从数据本身的角度来考虑的,而数据标注质量的评估则更多的是需要从数据的语义角度来考虑。
因此,寻找一种有效的图像分类数据标注质量的评估方法成为图像识别领域普遍关注的问题。
发明内容
有鉴于此,本发明的目的在于提供一种图像分类数据标注质量的评估方法,用以解决现有技术中,在对标注人员的标注数据进行审核时,采用人工作业来完成审核,导致审核的人力成本较高,并且审核的效率和准确率较低的问题。
根据本发明的目的提出的一种图像分类数据标注质量评估方法,包括:
提供一图像数据集,所述图像数据集包括图像及对每幅图像进行人工标注后得到的分类数据;
图像特征提取,基于图像HSV通道提取每一幅图像中描述图像颜色的多个特征向量,以及基于图像的局部特征提取每一幅图像中用于描述图像外观的多个特征向量;
特征离散程度度量,利用统计量分析,对所述颜色和/或外观特征向量的离散程度进行建模;
自动化评分,基于建模得到的离散程度模型对所述图像进行打分排序,并以排序结果对所述分类数据进行评估。
优选的,所述颜色特征向量的提取,包括:
将所述图像从RGB通道格式转换到HSV通道格式;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海铼锶信息技术有限公司,未经上海铼锶信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910239565.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置