[发明专利]一种面向层次标记样本的隐多标记分类方法在审
申请号: | 202110655504.7 | 申请日: | 2021-06-11 |
公开(公告)号: | CN113344080A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 张敏灵;於泽邦 | 申请(专利权)人: | 东南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 薛雨妍 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 层次 标记 样本 分类 方法 | ||
本发明公开了一种面向层次标记样本的隐多标记分类方法,该方法包括以下步骤:(1)用户从存储设备中选择训练样本;(2)根据训练样本,提取特征集合,标注层次标记集合;(3)根据编码规则,将训练样本的层次标记集合编码为隐多标记集合;(4)根据训练样本的特征集合与隐多标记集合,学习隐多标记分类器;(5)使用隐多标记分类器对测试样本进行分类;(6)根据解码规则,将测试样本的隐多标记集合解码为层次标记集合;(7)若用户对分类结果满意,则过程结束;否则,从存储设备中选择更多训练样本,转到步骤(2)。本发明适用于对以标记树中的标记路径作为标记集合的样本进行分类。
技术领域
本发明涉及一种分类方法,主要针对具有树状层次标记体系的样本,属于层次分类技术领域,尤其涉及一种面向层次标记样本的隐多标记分类方法。
背景技术
层次分类是一种对具有层次标记体系的样本进行分类的任务。假设标记全集C={c1,…,cl},存在二元关系<:
(1)对于任意一个标记ci∈C,满足
(2)对于任意两个标记ci,cj∈C,如果ci<cj,那么
(3)对于任意三个标记ci,cj,ck∈C,如果ci<cj并且cj<ck,那么ci<ck。
(4)存在一个标记r∈C,对于任意一个标记c≠r,满足c<r。
那么标记全集C就构成了层次标记,其中标记r为根。
一般来说,层次分类的标记全集总是构成一棵标记树。对于任意一个示例x,层次分类都要求为其分配一条标记路径p=r,v1,…,vh,其中结点v1,…,vh∈C且结点vh是叶结点。因此,层次分类可以被描述为,给定训练集D={(xi,Yi=pi)|1≤i≤n},学习一个分类映射f,使得对于任意测试示例x,都能由标记集合Y=f(x)给出其正确的标记路径p。
主流层次分类方法可以分为三种类型,即平坦分类、局部分类、全局分类:
(1)平坦分类完全忽略层次标记,仅对叶结点进行分类。虽然这种分类方法非常简单,但是需要通过一个分类器学习所有叶结点,并且无法利用标记之间的相关性。
(2)局部分类自上而下依次进行分类。虽然这种分类方法容易理解,但是需要建立多个分类器,并且层次越低训练样本越少。此外,局部分类只能利用父子标记的依赖性,无法利用非父子标记的相关性。而且,当某一层次分类错误时,错误将会向下传播难以纠正。
(3)全局分类使用一个多标记分类器来学习所有标记。虽然这种分类方法可以利用所有标记之间的相关性,但是现有的将层次分类转化为多标记分类的直接转化策略会造成不自然的转化结果,进而影响多标记分类器的学习效果。
发明内容
为解决上述问题,本发明公开了一种面向层次标记样本的隐多标记分类方法,通过隐多标签转化策略将层次分类转化为隐多标签分类,通过条件随机场充分利用所有标记之间的相关性,最终提高多标记分类器的分类性能。
一种面向层次标记样本的隐多标记分类方法,包括以下步骤:
(1)用户从存储设备中选择训练样本;
(2)根据训练样本,提取特征集合,标注层次标记集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110655504.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:跨点频响与动态响应特征融合的轴系疲劳损伤预测方法
- 下一篇:稳定视频