[发明专利]一种基于改进朴素贝叶斯的个人收入分类方法有效

专利信息
申请号: 201710323947.X 申请日: 2017-05-10
公开(公告)号: CN107169515B 公开(公告)日: 2020-12-15
发明(设计)人: 宁可;孙同晶;曹红 申请(专利权)人: 杭州电子科技大学
主分类号: G06K9/62 分类号: G06K9/62;G06Q40/00
代理公司: 杭州君度专利代理事务所(特殊普通合伙) 33240 代理人: 杜军
地址: 310018 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 改进 朴素 贝叶斯 个人 收入 分类 方法
【说明书】:

发明提出一种基于改进朴素贝叶斯的个人收入分类方法。该方法首先提出了基于连续型数据的类条件概率估计方法,用以确定各类的先验概率和类条件概率。其次,在分割后的数据集中引入拉普拉斯校准,避免0点影响过大的问题。再次,提出一种基于Apriori算法的改进关联规则算法,这种方法可以根据训练集的分类结果来衡量两个属性之间的密切关系。最后,引入属性加权的概念,从而解决朴素贝叶斯算法所有属性对结果影响相同的问题。

技术领域

本发明属于分类方法领域,涉及一种处理连续型数据的改进朴素贝叶斯分类方法,具体是一种基于改进朴素贝叶斯的个人收入分类方法,用于判断个人收入属于何种水平。

背景技术

随着社会的不断发展,人们的购买力也在不断的提高,网上购物也成为了年轻人的主要购买手段。因此,一大批的购物网站应用而生,伴随着的是对于商品推荐系统的旺盛需求。

在推荐商品时,首先应该对用户的收入水平进行确认,然后根据收入对用户进行分类,再对不同类的用户推荐不同的商品。但是目前的大部分用户分类系统都是根据用户购买东西的种类和数量进行分类,这种分类方法有一定的优势,它可以根据用户的购物记录对老用户进行准确的分类,确定这些用户属于哪一类的收入水平。但是对于新注册的用户,由于没有购买记录,因此无从判断。

本发明基于这一现状,提出了一种基于改进朴素贝叶斯的个人收入判断分类方法。

分类是用于数据挖掘、机器学习和模式识别等方面的一个关键步骤。它属于有监督学习,主要过程是通过对数据集进行分析,从而得到数据集中蕴含的分类原理,进而建立分类器,然后依靠分类器来确定未分类的数据所属的类别。

朴素贝叶斯分类算法是基于贝叶斯定理实现的。贝叶斯定理是在条件概率已知的情况下,可以得到两个事件交换后的概率。而朴素贝叶斯算法就是基于这种原理发展出来的,对于给出的待分类项,求解在此项出现的条件下,属于各个类别时分别出现的概率,哪个最大,就认为此待分类项属于哪个类别。但是,由于贝叶斯定理的条件独立特性和所有属性对结果影响程度相同的问题,在朴素贝叶斯算法实际使用时,其准确度偏低,所以很多人据此对朴素贝叶斯算法做出了改进。

目前对朴素贝叶斯算法的改进方法主要有:第一种,利用频繁项集的针对文本数据的结合Apriori算法改进朴素贝叶斯分类器,这种方法分类效果极佳,但是使用范围较窄,只适用于文本数据;第二种,针对属性对结果影响的结合属性加权的朴素贝叶斯分类器,这种方法可以在一定程度上提高分类的准确率,但是在单独使用的情况下仍然无法得到优秀的效果;第三种,针对算法的基本公式进行改进,这种方法在提高准确率的同时不会造成其他的后果,但是改进面较窄,不利于之后的进一步研究。

发明内容

本发明的目的针对上述问题,提出一种基于关联规则的改进贝叶斯分类方法,并将其应用于个人收入判断分类方法中。这种方法是基于关联规则来提升准确率的,可以适用于除文本数据以外的其他种类的数据集,解决了关联规则改进的贝叶斯算法只适应于文本分类的问题。在本方法中首先提出了基于连续型数据的类条件概率估计方法,用于确定各类的类条件概率。其次,在分割后的数据集中引入拉普拉斯校准,避免0点影响过大的问题。再次,提出一种改进关联规则算法,这种方法可以根据训练集的分类结果来衡量两个属性之间的密切关系。最后,引入属性加权的概念,从而解决朴素贝叶斯算法所有属性对结果影响相同的问题。

为实现上述技术问题,本发明所采用的技术解决方案如下:一种基于连续型数据集的改进朴素贝叶斯算法,包括以下步骤:

步骤(1)、获取用于甄别居民收入水平的数据集,其中属性变量包括年龄、工种、学历、性别、工作地点等用于对居民收入水平进行分类的信息;

上述收集的数据集属性变量包括连续型属性和离散型属性;

步骤(2)、对步骤(1)获取的数据集中离散文字型属性进行量化处理:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710323947.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top