[发明专利]一种核范数驱动的数据分类方法及系统在审

专利信息
申请号: 201610554118.8 申请日: 2016-07-14
公开(公告)号: CN106203517A 公开(公告)日: 2016-12-07
发明(设计)人: 张召;贾磊;李凡长;张莉;王邦军 申请(专利权)人: 苏州大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 罗满
地址: 215123 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种核范数驱动的数据分类方法及系统,该方法包括:首先利用训练集中的样本构造权重系数矩阵,用于表征样本间的相似性,再初始化一个初始类别矩阵;其次,为了准确可靠地度量近邻重构误差,采用了核范数来度量流形平滑项,在优化过程中,基于核范数的近邻重构误差最小化问题可转化成求解一系列Frobenius范数的优化问题,同时,在度量预测标签与人工初始标签之间的差异的过程中,为了提升模型对于噪音的鲁棒性和度量的准确性,提出基于加权L2,1范数的标签拟合项。最后,取软类别标签向量中概率值最大项用于类别鉴定,得到最准确的分类结果。此外,使用核范数作为距离度量比L1范数或L2范数更可靠,有效提升了模型的预测精准度。
搜索关键词: 一种 范数 驱动 数据 分类 方法 系统
【主权项】:
一种核范数驱动的数据分类方法,其特征在于,基于核范数作为距离度量的思想,该方法包括:依据训练集中训练样本的初始标签信息确定初始类别矩阵Y,以及通过对所有所述训练样本执行近邻搜索操作构造得到相似度量矩阵,并对所述相似度量矩阵进行对称化、归一化处理得到权重系数矩阵W;其中,所述训练集包括有标签训练样本和无标签训练样本,所述权重系数矩阵W用于表征样本间的近邻特性;基于所述初始类别矩阵Y和所述权重系数矩阵W,通过平衡近邻重构项和标签拟合项建立直推式标签传播模型,利用所述直推式标签传播模型进行迭代优化得到所述训练集的软类别标签预测矩阵F;其中,所述近邻重构项是可靠的核范数度量的重构错误项,用于定义流形平滑项,所述标签拟合项是基于加权L2,1范数正则化的标签拟合项;利用所述软类别标签预测矩阵F,计算得到测试样本的软类别标签向量,根据软类别标签向量中概率的最大值对应的类别确定所述测试样本的类别,得到最准确的分类结果;其中,所述软类别标签向量中的元素为所述测试样本归属各个类别的概率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610554118.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top