[发明专利]一种针对样本性质提取有效特征的方法在审
申请号: | 201610202600.5 | 申请日: | 2016-04-01 |
公开(公告)号: | CN105894032A | 公开(公告)日: | 2016-08-24 |
发明(设计)人: | 詹德川;姜远;周志华;李静 | 申请(专利权)人: | 南京大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李玉平 |
地址: | 210046 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种针对样本性质提取有效特征的方法,包括训练样本特征序列化步骤、样本特征选择器与对应模型训练步骤和针对样本的模型分类步骤;分类时初期设定一个初始的特征集,对于每一个需要分类的样本根据当前已有特征集决定下一步需要提取特征集,然后判断是否停止提取特征,如果还需要提取特征,则重复上一步过程,如果停止提取特征,就输入到合适的分类器进行分类,得到预测结果。与现有技术相比,本发明充分考虑了样本特征提取的时间开销和分类的置信度。 | ||
搜索关键词: | 一种 针对 样本 性质 提取 有效 特征 方法 | ||
【主权项】:
一种针对样本性质提取有效特征的方法,其特征在于:包括训练样本特征序列化步骤、样本特征选择器与对应模型训练步骤和针对样本的模型分类步骤;所述训练样本特征序列化的具体步骤为:步骤100,对训练样本数据进行标注,获取所有特征和相应特征的时间开销;步骤101,根据获取的特征,计算训练样本样本对之间的欧式距离;步骤102,根据样本对之间的距离和设置的近邻个数,寻找训练样本的近邻集合;步骤103,在训练样本的近邻集合中计算每个训练样本各个特征具有的权重,即各组特征对样本分类的有用程度;步骤104,对特征进行排序,权重值越大,说明该特征对分类的贡献越大,应该早一点提取;所述样本特征选择器与对应模型训练的具体步骤为:步骤200,对训练数据进行序列化之后,把数据按照已有特征集和下一步需提取特征集的形式进行拆分,得到一组特征集对;步骤201,根据拆分的特征集对,训练基于当前已有特征的特征选择器G和针对不同的特征组合的分类器;所述的模型分类的具体步骤为:步骤300,对测试样本提取初始特征集;步骤301,根据评价指标,判断是否需要提取下一个特征集,若需要,跳转至步骤302;否则跳转至步骤303;步骤302,根据已有特征集和特征选择器G,决定下一步需要提取的特征集,并把当前提取特征集与已有特征集合并,跳转至步骤301;步骤303,根据当前已有特征集寻找训练好的对应的分类模型进行分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610202600.5/,转载请声明来源钻瓜专利网。
- 上一篇:电热模块
- 下一篇:GSM/GPS双模车联网模块