[发明专利]一种草图数据集的交互式类别标注方法有效
申请号: | 201410764689.5 | 申请日: | 2014-12-12 |
公开(公告)号: | CN104392253A | 公开(公告)日: | 2015-03-04 |
发明(设计)人: | 王爽;孙正兴;刘凯;李博 | 申请(专利权)人: | 南京大学 |
主分类号: | G06K9/66 | 分类号: | G06K9/66 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华 |
地址: | 210023 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 草图 数据 交互式 类别 标注 方法 | ||
1.一种计算机中草图数据集的交互式类别标注方法,其特征在于,包括以下步骤:
步骤一,学习过程:对草图数据集中的已标注草图数据集进行多特征提取,对提取的草图特征进行特征空间度量学习,得到距离度量函数;
步骤二,选择过程:判断如果草图数据集中全是已标注草图数据集,不存在待标注草图数据集,则结束,得到最终结果,即完全标注草图数据集;否则,根据特征空间度量学习结果,对草图数据集中的待标注草图数据集进行特征空间构造,并进行层次化聚类;在聚类结果中,选取聚类纯度最高的聚类,作为最优样本子集;
步骤三,在线标注:用户对选取的最优样本子集中的草图进行交互子集确认,确认的草图是已知类别或者新类别;将用户子集确认的草图进行类别标注,并更新已标注草图数据集,对更新的已标注草图数据集进行多特征提取,对提取的草图特征进行特征空间度量学习,得到更新的距离度量函数;对于子集确认中剩余的草图,即最优样本子集中的非同类草图,保持未标注状态,并更新待标注草图数据集,返回步骤二;若子集确认中无剩余草图,则更新待标注草图数据集后,返回步骤二。
2.根据权利要求1所述的一种计算机中草图数据集的交互式类别标注方法,其特征在于,步骤一和三中所述多特征提取包括以下步骤:
步骤111,傅里叶描述子方法,计算边界点到形状质心的距离ri1为:
其中,(xi1,yi1)为表示第i1个边界点坐标,边界曲线共包含N1个边界点,质心坐标(xc1,yc1)计算公式为:
对距离ri1进行快速傅里叶变换得到傅里叶级数:
其中,j为复数的虚单位,n1为计数参数;
步骤112,Zernike矩方法:定义在单位圆上的复值函数集{Vnm(xi2,yi2)},则在单位圆内的任何平方可积函数为:
Vnm(xi2,yi2)=Vnm(ρ,θ)=Rnm(ρ)exp(jmθ),
其中,ρ表示从原点到第i2个点(xi2,yi2)的矢量距离向量;θ表示向量ρ跟x轴之间的逆时针方向的夹角,Rnm(ρ)表示点(xi2,yi2)的径向多项式,定义为:
i3为之间的整数,Zernike矩的阶数n为正整数或0,循环数m为正整数或负整数,且满足n-|m|为偶数,则n阶且具有m重循环的Zernike矩Anm为:
其中,j为复数的虚单位;
步骤113,BOW方法:对每一幅草图,划分为4*4的小块,抽取每个小块的方向向量l,组合成一个列向量表示最终的局部块描述子d=[l1,...,lj1]T,j1为方向向量的数目,对每个局部块描述子进行归一化,归一化后,得到一个特征包D={di4},包括i4个局部块描述子,i4为0到N2-1之间的正整数,N2为局部特征块的数目;
对于局部块描述子d,使用k1均值聚类构建视觉词典,将所有局部块描述子划分为k1个中心不相连的聚类,定义视觉词典V1为向量集合{μi5},使得最小,dj2为第j2个局部块描述子,μi5为第i5个向量,定义为:
其中,Ci5为视觉词典中的第i5个聚类,i5取值范围为1~k1,k1为局部块描述子聚类数目;
视觉词的频率直方图h定义为:
其中,di6为第i6个局部块描述子,i6为正整数,取值范围为0~N2-1,
q(di6)是一个向量值量化函数,定义为:
q(di6)=[K(di6,μ1),...,K(di6,μk1)]T,
其中,计算样本点之间的距离K为:
K(d,μj3)=exp(-||d-μj3||2/2σ2),j3=1,…,k1,
其中,μj3为视觉字典中的第j3个向量,参数σ设置为1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410764689.5/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置