[发明专利]一种基于Hellinger距离的懒惰决策树方法在审
申请号: | 201610626533.X | 申请日: | 2016-08-01 |
公开(公告)号: | CN106156803A | 公开(公告)日: | 2016-11-23 |
发明(设计)人: | 苏翀 | 申请(专利权)人: | 苏翀 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 赵芳 |
地址: | 210000 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于Hellinger距离的懒惰决策树方法,包括:判断训练数据集中的样本的所属类别,属于同一类则赋予待测样本该类别;否则判断训练数据集中的样本是否具有相同的属性值,若具有相同的属性值,则将在训练数据集中占最大比例的类别作为待测样本的类别;若均不满足,则采用Hellinger距离作为选择分裂属性的度量指标,选择使得该指标最大化的属性作为分裂属性;将训练数据集中分裂属性值等于待测样本分裂属性值的样本子集作为下一次选择分裂属性的训练数据集,并从属性集中移除分裂属性;重复上述步骤,直到满足第一步或训练数据集中分裂属性值等于待测样本分裂属性值的样本子集为空时,算法终止;形成一条为待测样本分类的决策路径。 | ||
搜索关键词: | 一种 基于 hellinger 距离 懒惰 决策树 方法 | ||
【主权项】:
一种基于Hellinger距离的懒惰决策树方法,其特征在于,所述方法包括下述步骤:A、判断训练数据集中的样本的所属类别,若属于同一类,则赋予待测样本该类别;否则,判断训练数据集中的样本是否具有相同的属性值,若具有相同的属性值,则将在训练数据集中占最大比例的类别作为待测样本的类别;B、若上述两种情况均不满足,则采用对非均衡类分布不敏感的度量指标Hellinger距离作为选择分裂属性的度量指标,选择使得该指标最大化的属性作为分裂属性;将训练数据集中分裂属性值等于待测样本分裂属性值的样本子集作为下一次选择分裂属性的训练数据集,并从属性集中移除分裂属性;C、重复上述两个步骤,直到满足第一步中的两个情况或者训练数据集中分裂属性值等于待测样本分裂属性值的样本子集为空时,算法终止;最终形成一条为待测样本分类的决策路径。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏翀,未经苏翀许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610626533.X/,转载请声明来源钻瓜专利网。
- 上一篇:小麦草洁厕缓释颗粒
- 下一篇:美洲大蠊有效部位结肠片及其制备方法