[发明专利]一种基于样本集的多属性目标的分类方法在审
申请号: | 202011590759.1 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112699935A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 邓少冬 | 申请(专利权)人: | 西安米克斯智能技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京利丰知识产权代理事务所(特殊普通合伙) 32256 | 代理人: | 艾中兰 |
地址: | 710068 陕西省西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 样本 属性 目标 分类 方法 | ||
本发明公开一种基于样本集的多属性目标的分类方法,根据已知样本集和待分类目标的已知属性,筛选出样本子集,如果筛选出的样本自己具有单一的类别属性,则待分类目标的类别为该单一类别;否则选择待分类目标的一个新已知属性,对筛选出的样本子集继续进行筛选,直到本次分类完成或本次分类失败。本发明可以实现分类的可解释性,给出样本集和分类方法的改进方向,将复杂的多维分类问题简化为单维度样本筛选,提供了探索式的目标分类方法,提升了分类方法的效率。
技术领域
本发明属于机器学习、人工智能技术领域,具体涉及一种分类方法。
背景技术
分类问题的目标是根据已知样本的某些特征,判断一个新的样本属于哪种已知的样本类。根据类别的数量还可以进一步将分类问题划分为二元分类(binaryclassification)和多元分类(multiclass classification)。
例如,在邮件管理中,将一封邮件归类为“垃圾邮件”或者“非垃圾邮件”就是一个典型的二元分类问题;银行对信用卡客户进行信用等级分类和上市公司股票类型的划分则属于多元分类问题。
经过多年的发展,机器学习发展出众多的分类方法,常见的分类方法包括:
线性分类器
朴素贝叶斯分类器(naive bayes classifier)
感知器(perceptron)
支持向量机(support vector machine)
最近邻居法(k-nearest neighbor)
决策树(decision trees)
随机森林(random forests)
神经网络(neural networks)
其中,线性分类器中的判别分析和逻辑回归是最基础、最具代表性的分类方法。判别分析是一种简单直观的分类方法,它基于观测值与不同类别之间距离差异进行分类。利用样本构造判别函数,根据观测点与不同类别中心点的距离,将其归属于距离“最短”的那一类;而逻辑回归分类则是先建立一个回归模型(regression model),然后采用极大似然估计(maximum likelihood estimation)方法估计模型参数,得出回归的拟合值,最后通过数学方法在不同的概率中作出决策,完成分类问题。
分类算法在医学、生物学和经济管理等诸多领域都有着广泛的应用,日常使用的图像识别,手写数字识别、语音识别等都可以归结为分类。
无论是判别分析,还是基于神经网络的深度学习方法,现有分类方法试图从已有的样本中提炼一个分类函数,这个函数的输入对应目标的各属性的值,或者是目标的多维向量,而输出对应到特定的类别。将待分类的目标的属性值或多维向量输入分类函数,就可以获得目标类别。当前的分类方法存在以下问题:
a、分类的结果是分类函数的输出,虽然分类函数是从已知样本中总结出来的,但具体目标的分类结果无法解释,也就是只能输出是什么,而不能给出为什么是。对于样本存在错误或者样本不够的情况,无法给出样本的改进方向;
b、分类函数一般是多个参数构成形式明确的函数,但目标属性的认知是逐步深化和增加的,新增的目标属性可能构成更好的分类依据,分类函数在样本和目标新增属性以后需要重新训练,无法基于已有基础优化;
c、分类函数的容量对应于函数参数的个数,固定的分类函数形式限制了函数参数的个数以及分类函数的容量,无法动态适应样本的变化的属性个数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安米克斯智能技术有限公司,未经西安米克斯智能技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011590759.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:有机发光二极管显示面板
- 下一篇:一种医用胃肠科护理用可调节减压冲洗装置