[发明专利]一种基于正交回归和特征加权的有监督特征选择方法在审
申请号: | 201910831014.0 | 申请日: | 2019-09-02 |
公开(公告)号: | CN110533114A | 公开(公告)日: | 2019-12-03 |
发明(设计)人: | 邬霞;徐雪远;魏馥琳 | 申请(专利权)人: | 北京师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 11463 北京超凡宏宇专利代理事务所(特殊普通合伙) | 代理人: | 安卫静<国际申请>=<国际公布>=<进入 |
地址: | 100000 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 算法模型 迭代运算 偏差向量 特征矩阵 权重对角矩阵 冗余特征 特征选择 正交 有效指标信息 最优特征子集 矩阵 标签数据 加权参数 交替固定 特征数据 回归 构建 加权 申请 监督 | ||
1.一种基于正交回归和特征加权的有监督特征选择方法,其特征在于,包括:
根据获得的特征矩阵和与所述特征矩阵对应的标签数据构建第一算法模型,所述第一算法模型包括偏差向量;
对所述第一算法模型求所述偏差向量的偏导,获得所述偏差向量;
将所述偏差向量代入所述第一算法模型计算,获得第二算法模型,所述第二算法模型包括:正交回归矩阵和权重对角矩阵;
交替固定所述正交回归矩阵以及固定所述权重对角矩阵,对所述第二算法模型进行迭代运算,确定迭代运算后的第二算法模型;
根据所述迭代运算后的第二算法模型的权重对角矩阵确定冗余特征;
根据所述冗余特征从所述特征矩阵中选择出特征数据。
2.根据权利要求1所述的方法,其特征在于,所述根据所述迭代运算后的第二算法模型的权重对角矩阵确定冗余特征,包括:
将所述迭代运算后的权重对角矩阵的主对角线上的元素确定为权重列向量;
将权重列向量中的权重小于阈值对应的特征确定为冗余特征。
3.根据权利要求1所述的方法,其特征在于,所述交替固定所述正交回归矩阵以及固定所述权重对角矩阵,对所述第二算法模型进行迭代运算,包括:
固定所述权重对角矩阵,使用广义功率迭代法对所述第二算法模型计算所述正交回归矩阵;
将所述正交回归矩阵代入所述第二算法模型计算,获得第三算法模型;
固定所述正交回归矩阵,使用增广拉格朗日乘子法对所述第三算法模型计算所述权重对角矩阵;
若所述第二算法模型的函数值不收敛,则执行所述固定所述权重对角矩阵,使用广义功率迭代法对所述第二算法模型计算所述正交回归矩阵。
4.根据权利要求3所述的方法,其特征在于,所述固定所述权重对角矩阵,使用广义功率迭代法对所述第二算法模型计算所述正交回归矩阵,包括:
固定所述权重对角矩阵,将所述第二算法模型转换为使用广义功率迭代法对计算所述正交回归矩阵;
其中,A为对称矩阵,所述对称矩阵满足的条件为A∈RD×D,B=ΘXHYT为第二替代参数,所述第二替代参数满足的条件为B∈RD×K;X=[x1,x2,…,xd,…,xD]T为所述特征矩阵,X满足的条件为X∈RD×N,D为所述特征矩阵中的特征的数量,D满足的条件为1≤d≤D,xd为所述特征矩阵中的第d个特征,Y=[y1,y2,…,yn,…,yN]T为所述标签数据,Y满足的条件为Y∈RK×N,N为所述标签数据中的标签的数量,N满足的条件为1≤n≤N,yn为所述标签数据中的第n个标签,T为对矩阵的转置运算,K为所述标签数据和所述特征矩阵的类别数,IN为一个N×N的单位矩阵,1N为全为1的列向量,即1N=[1,1,…,1]T∈RN×1,W∈RD×K为所述正交回归矩阵,满足正交回归约束WTW=IK,Θ∈RD×D为所述权重对角矩阵,θ为所述权重对角矩阵的主对角线上元素确定为的权重列向量,且θT1D=1,θ≥0代表特征的重要性,所述权重列向量中的各个元素表示每个特征的权重,每个权重值都大于等于0,且相加和为1;b∈RK×1为所述偏差向量;表征求矩阵为M的Frobenius范数,即求矩阵为M的各项元素的绝对值平方的总和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京师范大学,未经北京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910831014.0/1.html,转载请声明来源钻瓜专利网。