[发明专利]一种草图数据集的交互式类别标注方法有效
申请号: | 201410764689.5 | 申请日: | 2014-12-12 |
公开(公告)号: | CN104392253A | 公开(公告)日: | 2015-03-04 |
发明(设计)人: | 王爽;孙正兴;刘凯;李博 | 申请(专利权)人: | 南京大学 |
主分类号: | G06K9/66 | 分类号: | G06K9/66 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华 |
地址: | 210023 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种计算机中草图数据集的交互式类别标注方法,包括以下步骤:学习过程,对已标注草图数据集进行多特征提取,特征空间度量学习,计算距离度量函数。选择过程,如果判断草图数据集中不存在未标注草图,则结束,得到最终结果。否则,根据度量学习结果,对待标注草图数据集进行特征空间构造,层次化聚类,并选择最优样本子集。在线标注,用户对最优样本子集中的草图进行交互确认,对确认的样本进行类别标注,并更新已标注草图数据集。剩余的非同类草图,将保持未标注状态,并更新待标注草图数据集。进而不断循环上述过程,直到用户完成所有草图标注,获得最终标注结果。 | ||
搜索关键词: | 一种 草图 数据 交互式 类别 标注 方法 | ||
【主权项】:
一种计算机中草图数据集的交互式类别标注方法,其特征在于,包括以下步骤:步骤一,学习过程:对草图数据集中的已标注草图数据集进行多特征提取,对提取的草图特征进行特征空间度量学习,得到距离度量函数;步骤二,选择过程:判断如果草图数据集中全是已标注草图数据集,不存在待标注草图数据集,则结束,得到最终结果,即完全标注草图数据集;否则,根据特征空间度量学习结果,对草图数据集中的待标注草图数据集进行特征空间构造,并进行层次化聚类;在聚类结果中,选取聚类纯度最高的聚类,作为最优样本子集;步骤三,在线标注:用户对选取的最优样本子集中的草图进行交互子集确认,确认的草图是已知类别或者新类别;将用户子集确认的草图进行类别标注,并更新已标注草图数据集,对更新的已标注草图数据集进行多特征提取,对提取的草图特征进行特征空间度量学习,得到更新的距离度量函数;对于子集确认中剩余的草图,即最优样本子集中的非同类草图,保持未标注状态,并更新待标注草图数据集,返回步骤二;若子集确认中无剩余草图,则更新待标注草图数据集后,返回步骤二。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410764689.5/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置