[发明专利]一种基于图的半监督分类机器学习新方法在审
申请号: | 201810437033.0 | 申请日: | 2018-05-09 |
公开(公告)号: | CN108596272A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 刘建峰 | 申请(专利权)人: | 重庆三峡学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N99/00 |
代理公司: | 重庆晶智汇知识产权代理事务所(普通合伙) 50229 | 代理人: | 李靖 |
地址: | 404100 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预处理 样本标记 半监督 半监督学习 无监督学习 训练样本集 分类机器 难度降低 数据样本 训练样本 样本分类 训练集 分类 学习 监督 | ||
1.一种基于图的半监督分类新方法,包括如下步骤:
步骤S001:划分训练集;
训练集X=L∪U={x1,…xl,xl+1,…xl+u},L={x1,…xl}是少量有标签样本,U={xl+1,…xl+u}为大量无标签样本;标记样本占比
步骤S002:构造非对称稀疏权重矩阵;
式中,j=1,2,…,k-1,k+1,…,n表示样本xk由其余样本线性表示的稀疏分解系数;
步骤S003:求解非对称权重矩阵;通过求解优化问题求解非对称权重矩阵;
步骤S004:计算目标函数
步骤S005:采用符号函数判断样本类别。
2.根据权利要求1所述的一种基于图的半监督分类新方法,其特征在于:在所述步骤S001划分训练集中,采用主动样本标记方法,标记具有最大边界信息量样本,对样本进行预处理,包括如下步骤:
步骤D000:计算为所有无标签样本的类别概率差值Li,j(x);所述类别概率差值计算公式为:
步骤D001:选取类别概率差值Li,j(x)小于预设阈值δ的所有无标签样本作为具有最大边界信息量样本;
步骤D002:将选取具有最大边界信息量样本由训练完成的3个初始化分类器进行类别标定,将标定后样本划分为有标签样本集。
3.根据权利要求2所述的一种基于图的半监督分类新方法,其特征在于:所述预设阈值δ=2.5×10-2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆三峡学院,未经重庆三峡学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810437033.0/1.html,转载请声明来源钻瓜专利网。