[发明专利]一种层链式多标签学习模型在审
申请号: | 202110719812.1 | 申请日: | 2021-06-28 |
公开(公告)号: | CN113392982A | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 殷继彬;赵鹏飞 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 安徽思沃达知识产权代理有限公司 34220 | 代理人: | 朱海东 |
地址: | 650500 云南省昆明市呈*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 链式 标签 学习 模型 | ||
本发明公开了一种层链式多标签学习模型,涉及样本数据处理技术领域,包括以下步骤:预先对多标签学习任务的数据集进行分析,并将数据标签集中的标签进行层链划分;基于层链划分,进行将第一层链的标签输入分类器模型进行学习与预测,得到第一层的预测标签信息;将第一层链的标签组合并将其作为新的特征对数据集样本维度进行扩充;将扩充后的数据集放入第二层链的分类器模型进行进一步的学习与预测。本发明通过对标签集中标签的层链划分操作,能够更好地考虑与挖掘标签间的潜在关联性,对于复杂多标签任务以及标签关联性高的多标签任务能够对数据和标签信息进行更为充分的理解与学习。
技术领域
本发明涉及样本数据处理技术领域,具体来说,涉及一种层链式多标签学习模型。
背景技术
在一般的有监督学习分类中,大多数样本数据都包含若干特征向量,并对应唯一的标签,称之为单标签学习,而单标签学习又包括了单类分类任务与多类分类任务。但是在现实研究与应用中,并不是所有实例都只与一个单一的标签相关联,在一些复杂的综合性问题中一个实例可能会与多个类别标签相关联,这就是多标签分类问题,它的任务是通过学习为每个新实例预测一个多标签组合。
目前,现有的经典多标签学习模型包括一阶策略的Binary Relevance、ML-DT和ML-KNN;二阶策略的Calibrated Label Ranking和Rank-SVM;三阶策略的ClassifierChain、Label Powerset和RAkEL等。但随着各领域复杂数据与任务的增多,这些现有经典多标签学习模型显露出没有对标签信息及标签间的潜在关联性进行充分挖掘的缺点,所训练的分类器模型对复杂任务数据的理解不够充分。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的问题,本发明提出一种层链式多标签学习模型,通过对标签集中标签的层链划分操作,能够更好地考虑与挖掘标签间的潜在关联性,对于复杂多标签任务以及标签关联性高的多标签任务能够对数据和标签信息进行更为充分的理解与学习,相较于现有的经典多标签学习模型能够体现出更为优良的综合性能,以克服现有相关技术所存在的上述技术问题。
本发明的技术方案是这样实现的:
一种层链式多标签学习模型,包括以下步骤:
预先对多标签学习任务的数据集进行分析,并将数据标签集中的标签进行层链划分;
基于层链划分,进行将第一层链的标签输入分类器模型进行学习与预测,得到第一层的预测标签信息;
将第一层链的标签组合并将其作为新的特征对数据集样本维度进行扩充;
将扩充后的数据集放入第二层链的分类器模型进行进一步的学习与预测,并得到第二层的预测标签信息,并重复上述操作,直至最后一个层链;
将各层链的所有预测标签进行合并,并获得最终的预测结果的层链式多标签学习模型。
进一步的,所述将数据标签集中的标签进行层链划分,包括将特点和含义相同标签划入同一层链。
进一步的,所述将第一层链的标签组合,还包括以下步骤:
将各层链的标签组合进行独热编码转化。
本发明的有益效果:
1、本发明通过链式思想将标签集的标签进行了层链划分,在充分挖掘不同标签间潜在关联性的同时对标签信息也有更为深入的理解。另外,数据标签信息的层级递进预测也使分类器模型能够更为透彻地学习与理解数据特征。
2、本发明相较于现有的其它多标签学习模型,能够对一些复杂多标签任务以及标签关联性高的多标签任务进行更好地学习与分类,实现更佳的综合预测性能。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110719812.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多功能抽油杆耐磨合金护管连接器
- 下一篇:一种护肤纯天然植物精油及其制备方法