[发明专利]一种基于属性加权的朴素贝叶斯分类模型改进方法在审

专利信息
申请号: 201910437156.9 申请日: 2019-05-23
公开(公告)号: CN110222744A 公开(公告)日: 2019-09-10
发明(设计)人: 岳希;唐孟轩;唐聃;高燕 申请(专利权)人: 成都信息工程大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京元本知识产权代理事务所 11308 代理人: 王红霞
地址: 610225 四川省成都*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 加权 分类模型 贝叶斯 冗余属性 改进 剔除 数据处理分类 贝叶斯模型 独立性假设 数据预处理 分类结果 更新数据 加权系数 条件概率 先验概率 训练集 弱化 分组 分类 更新 统计
【说明书】:

发明公开了一种基于属性加权的朴素贝叶斯分类模型改进方法,涉及数据处理分类领域。本发明包括如下步骤:S1、数据预处理;S2、计算分组斯皮尔曼系数,剔除冗余属性,更新数据集;S3、求出各类的先验概率和类条件概率;S4、计算更新后的训练集每个属性的加权系数;S5、根据加权后的改进模型进行分类,并统计分类结果。本发明通过属性加权的方式有效的弱化了朴素贝叶斯分类模型的条件独立性假设,并且通过斯皮尔曼系数剔除了冗余属性,改进模型明显的提高了朴素贝叶斯模型的准确性和效率。

技术领域

本发明属于数据处理分类领域,特别是涉及一种基于属性加权的朴素贝叶斯分类模型改进方法。

背景技术

朴素贝叶斯分类算法是最为经典的分类方法。但是由于算法本身的条件独立特性和所有属性对结果影响相同的问题,在实际使用时该算法准确度偏低。目前对朴素贝叶斯算法的改进方法主要有:基于算法本身进行改进,如贝叶斯网络分类算法、双重贝叶斯分类算法、懒惰式贝叶斯网络分类算法等,这些方法使得贝叶斯分类算法的准确率和应用范围有所提升;结合其他方法对朴素贝叶斯分类算法进行改进,这种方法的改进方式较多,比如结合MapReduce框架对朴素贝叶斯算法进行改进,可以在保证准确度的基础上大幅减少运行时间,适用于大规模数据集;结合支持向量机算法对朴素贝叶斯算法进行改进,这种方法在处理多维数据集时有极大优势。

更加有效的是针对属性对结果影响的结合属性加权的朴素贝叶斯分类器,这种方法可以提高准确率;为了弱化属性条件独立性假设的束缚,提高NB的分类性能,通过属性选择或属性加权来提高NB的分类性能,数据集中的冗余属性不仅增加了分类模型学习过程中的计算量,同时还会降低分类的准确率,所以属性选择经常作为提高分类器性能的方法.和准朴素贝叶斯方法相比,属性选择不会改变NB模型的结构,同时可以有效提高NB的分类性能.但是实际中属性对类属性的归属的影响不同,而属性选择不能区分不同属性在分类过程中的重要程度。

为了解决上述问题,本发明选择的属性加权不仅可以排除冗余属性,还可以区分不同属性在分类过程的重要程度NB模型的属性条件独立性假设本质上是假定了各个属性对类属性的贡献相同,通过属性加权可以区分不同属性对类属性归属的不同影响,相较于其他优化方案,此方案减少了对于硬件环境的需求,同时也有效的提高了分类的效率和准确率。

发明内容

本发明的目的在于提供一种基于属性加权的朴素贝叶斯分类模型改进方法,通过属性加权的方式有效的弱化了朴素贝叶斯分类模型的条件独立性假设,并且通过斯皮尔曼系数剔除了冗余属性,改进模型明显的提高了朴素贝叶斯模型的准确性和效率,解决了现有的朴素贝叶斯分类属性间并不总是相互的独立、分类正确率和效率低的问题。

为解决上述技术问题,本发明是通过以下技术方案实现的:

本发明为一种基于属性加权的朴素贝叶斯分类模型改进方法,包括如下步骤:

步骤S1、数据预处理:将连续型的数据根据高斯分割进行数据离散化,对于非数字类的信息全部转化为数字后,再进行离散化处理;

步骤S2、计算分组斯皮尔曼系数:对于相关性大的组合进行属性融合,剔除冗余属性更新数据集;

步骤S3、求出各类的先验概率和类条件概率:采用拉普拉斯方法计算出各类的先验概率和类条件概率;

步骤S4、计算更新后的训练集每个属性的加权系数;其中,计算方法包括:

步骤S41、计算平均置信度W1;

步骤S42、计算关联度得分ReliefF系数W2;

步骤S43、根据W1和W2计算新的加权系数W;

步骤S5、根据加权后的改进模型进行分类,并统计分类结果;

其中,步骤S41中,具体的平均置信度属性加权过程如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都信息工程大学,未经成都信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910437156.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top