[发明专利]一种多视角数据的半监督特征选择方法在审
申请号: | 201610748139.3 | 申请日: | 2016-08-26 |
公开(公告)号: | CN106228027A | 公开(公告)日: | 2016-12-14 |
发明(设计)人: | 房鼎益;郑欣;许鹏飞;侯文静;徐丹;肖云;陈晓江;郭军;尹小燕 | 申请(专利权)人: | 西北大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 西安恒泰知识产权代理事务所61216 | 代理人: | 李婷;张明 |
地址: | 710069 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种多视角数据的半监督特征选择方法,该方法首先从不同的视角采集数据的特征构成数据样本,继而构建数据样本的特征选择矩阵、拉普拉斯矩阵、对角矩阵,然后利用特征选择矩阵定义目标函数,对特征选择矩阵更新并使目标函数收敛,然后利用收敛时的特征选择矩阵构成的分类器对样本进行分类。本发明有效地发掘出数据样本的内在结构,充分利用了所有数据样本的结构特性,能够在半监督场景下对多视角数据实现特征选择,在只具有少量标签数据的情况下取得了较好的分类性能。 | ||
搜索关键词: | 一种 视角 数据 监督 特征 选择 方法 | ||
【主权项】:
一种多视角数据的半监督特征选择方法,其特征在于,包括以下步骤:步骤一,数据预处理从k个不同的视角采集数据的特征构成数据样本X:X=[x1,x2,...,xn]∈Rd×n,上式中,n为样本数,d为特征,R为实数集,xi为样本,i∈(1,n),记X为训练数据集;对xi的每个视角中的特征进行归一化处理;定义Y∈{0,1}n×c为训练数据集X相应的类别矩阵,类别矩阵表示样本数据的分类结果,c为类别数目;定义W为训练数据集X相应的特征选择矩阵:W=w1(1)...wc(1)...wi(z)...w1(k)...wc(k)∈Rd×c]]>上式中,代表第z个视角的全部特征对第i类数据的分类能力,Wi(z,q)表示第z个视角中第q个特征对第i类数据的分类能力,dz为第z个视角的特征总数;步骤二,构建数据样本X的拉普拉斯矩阵L和选择对角矩阵U;步骤三,定义目标函数定义目标函数obj(W)为:obj(W)=Tr(FTLF)+Tr((F-Y)TU(F-Y))+μ||XTW+1nbT-F||F2+γ1||W||G1+γ2||W||2,1]]>上式中,||·||2,1分别表示矩阵的Frobenius范数的平方,group l1(G1)范数和l2,1范数;F=[f1,f2,....,fn]T∈Rn×c为数据样本X的预测标签矩阵,fi(1≤i≤n)为xi的预测类别向量,b∈Rc×1表示偏移项,Tr(·)表示矩阵主对角线元素之和,1n∈{1}n×1为元素都为1的列向量,μ、γ1、γ2是调节参数,取值均为10‑3;步骤四,更新特征选择矩阵W计算中间常量矩阵H、A、B:其中I是一个单位矩阵,1n∈{1}n×1为元素都为1的列向量;A=XH(μI‑μ2(L+U+μH)‑1)HXT,其中μ是调节参数,取值为10‑3;B=μXH(L+U+μH)‑1UY,记bl是B的第l列元素;随机初始化在时刻t=0时W∈Rd×c,然后利用下面的公式更新W的每一列wl,l表示列号:(wt+1)l=(2A+γ1D~t+γ2(Dt)l)-1(2bl)]]>上式中,(wt+1)l为t+1时刻的wl,Dl和都是对角矩阵,其中(Dt)l代表t时刻用以计算(wt+1)l的Dl,代表t时刻的γ1、γ2表示调节参数,取值均为10‑3;步骤五,将更新后的W代入目标函数obj(W)直至目标函数收敛,然后利用(XTW+b)对样本进行分类,得到最终的分类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610748139.3/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置