[发明专利]一种基于度量学习的多示例多标记分类方法在审
申请号: | 201810178168.X | 申请日: | 2018-03-05 |
公开(公告)号: | CN108491865A | 公开(公告)日: | 2018-09-04 |
发明(设计)人: | 胡海峰;崔志锴 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳;杜春秋 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于度量学习的多示例多标记分类方法,该方法在多示例多标记数据集中,选取一部分作为训练集;在训练集中根据每个标记对应的包,得到初始原型包;多示例多标记距离度量学习;求豪斯多夫距离,得到参考近邻和引证近邻;构建分类器;完成对未知标记的包的预测。本发明的优点是采用马氏距离代替欧氏距离,能更精确地找到不同包之间的语义近邻,并且利用改进后的多示例多标记kNN算法,显著提高kNN分类时的性能,同时由于包中标记和示例不是一一对应的,包中的标记事先并不知道采用哪个示例表示,因此本发明相对于事先知道标记和示例关系的包具有更广泛的适用行。 | ||
搜索关键词: | 多标记 度量 构建分类器 语义 距离度量 马氏距离 欧氏距离 数据集中 训练集 分类 学习 原型 参考 预测 改进 | ||
【主权项】:
1.一种基于度量学习的多示例多标记分类方法,其特征在于,包括以下步骤:第一步、在多示例多标记数据集中,选取一部分作为训练集;第二步、在训练集中根据每个标记对应的包,得到初始的原型包;第三步、采用多示例多标记距离度量学习构建、优化目标函数;第四步、求包与包之间的平均豪斯多夫距离,然后根据包与包之间的平均豪斯多夫距离,得到每个包的参考近邻和引证近邻;第五步、统计每个包的参考近邻和引证近邻中每个标记的个数,得到L维的包的标记计数向量,根据L维的包的标记计数向量构建一个L维的线性分类器;第六步、完成对未知标记的包的预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810178168.X/,转载请声明来源钻瓜专利网。