[发明专利]基于标签相关性的多标签流特征确定最优特征子集的方法在审

专利信息
申请号: 202110680679.3 申请日: 2021-06-18
公开(公告)号: CN113344091A 公开(公告)日: 2021-09-03
发明(设计)人: 尤殿龙;王杨 申请(专利权)人: 燕山大学
主分类号: G06K9/62 分类号: G06K9/62;G06K9/46
代理公司: 北京孚睿湾知识产权代理事务所(普通合伙) 11474 代理人: 刘翠芹
地址: 066004 河北省*** 国省代码: 河北;13
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 标签 相关性 特征 确定 最优 子集 方法
【权利要求书】:

1.一种基于标签相关性的多标签流特征确定最优特征子集的方法,其特征在于,其包括如下步骤:

步骤S1、将多个标签定义为标签集L,其中lj∈L,lj为L中的第j个标签,0≤j≤m,m为标签的个数;

步骤S2、计算标签集L中每个标签的重要性权重LW(lj),其具体包括以下子步骤:

S21、根据互信息计算两个标签之间的相关性w(li;lj),将两个相同的标签之间的互信息设为0,即当i=j时,w(li;lj)=0;根据互信息计算两个标签之间的相关性w(li;lj)的公式如下:

式中,MI(·,·)表示互信息,P(·,·)表示联合概率分布函数,P(·|·)表示条件概率分布函数,P(·)表示边缘概率分布函数,1≤k≤N,1≤q≤N,N表示实例的个数,lik表示标签li对应的实例是xk,xk=[x1,x2,…,xd],xk表示d维向量,ljq表示标签lj对应的实例是xq,xq=[x1,x2,…,xd],xq表示d维向量;

S22、将各个标签作为节点,构建加权无向图WUG,将两个标签之间的相关性的值作为加权无向图WUG中两个节点之间的边上的权重;

S23、根据构建的加权无向图WUG,利用以下公式计算每个标签的重要性权重LW(lj):

式中,SW(lj)表示各个标签和标签lj的互信息求和,LW(li)和LW(lj)分别表示标签li和标签lj的权重值;SN(li)表示指向标签节点li的节点的集合;w(li,lj)表示标签li和lj之间的相关性;d表示阻尼系数;每个节点均具有一个初始权重,该初始权重设置为1/m,其中m为节点的总数,即标签的总数;

步骤S3、定义模型中第i个特征到达的时刻为ti,并初始化ti=0,特征随着时间的推移依次流入模型;

步骤S4、定义在时刻ti到达的特征为fi;定义特征数的极限值为INF;定义候选特征集为CFS,并初始化定义相关性阈值为δ;

步骤S5、对i与INF的值进行比较,判断i≤INF是否成立;若成立,则执行步骤S6-S12;若不成立,结束所有步骤并退出;

步骤S6、判断步骤S4定义的候选特征集CFS是否为空集;若候选特征集CFS为空集,则进入步骤S7;若候选特征集CFS不为空集,则进入步骤S8;

步骤S7、当新流入一个特征fi时,判断新流入的特征fi与标签集L是否相关,对新流入的特征fi与标签集L进行相关性分析,若两者不相关,则删除该新流入的特征fi,并进入步骤S12;若两者相关,则将该新流入的特征fi加入到候选特征集CFSi-1,此时,候选特征集CFS=CFSi-1∪fi,之后进入步骤S12;

步骤S8、当新流入一个特征fi时,对特征fi进行显著性分析,判断特征fi是否为显著特征;若该新流入的特征fi为显著特征,则将该新流入的特征fi加入到候选特征集CFSi-1,此时,候选特征集CFS=CFSi-1∪fi;若该新流入的特征fi为非显著特征,则进入步骤S9;

步骤S9、判断该新流入的特征fi与标签集L是否相关,对该新流入的特征fi与标签集L进行相关性分析;若两者不相关,则删除fi并进入步骤S12;若两者相关,则进入步骤S10;

步骤S10、遍历候选特征集CFSi-1中的每个特征,判断CFSi-1中是否存在特征fk能代替该新流入的特征fi,若存在能代替特征fi的特征fk,则将该新流入的特征fi作为冗余特征删除并进入步骤S12;否则,进入步骤S11;

步骤S11、遍历候选特征集CFSi-1中的每个特征,判断该新流入特征fi能否代替CFSi-1中的某个特征fk,若CFSi-1中存在能够被新流入的特征fi代替的特征fk,则将该特征fk作为冗余特征从候选特征集CFSi-1中删除,CFSi-1=CFSi-1-fk,并将新流入的特征fi加入到候选特征集CFSi-1,此时,候选特征集CFS=CFSi-1∪fi,之后进入步骤S12;否则,直接将新流入的特征fi加入到候选特征集CFSi-1,候选特征集CFS=CFSi-1∪fi,之后进入步骤S12;

步骤S12、判断是否有特征未处理;若结果为是,则返回步骤S5按照流程重新进行操作;若结果为否,则输出最优特征子集SF=CFS。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于燕山大学,未经燕山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110680679.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top