首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]基于终生学习的增量式朴素贝叶斯文本分类方法有效

申请号：	201610983203.6	申请日：	2016-11-08
公开（公告）号：	CN108062331B	公开（公告）日：	2021-02-12
发明（设计）人：	夏睿;潘振春	申请（专利权）人：	南京理工大学
主分类号：	G06F16/35	分类号：	G06F16/35;G06K9/62
代理公司：	南京理工大学专利中心 32203	代理人：	陈鹏;朱显国
地址：	210094 ***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于终生学习增量朴素斯文分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于终生学习的增量式朴素贝叶斯文本分类方法，其特征在于，包括以下步骤：

步骤1，获取初始文本，构成文本集；

步骤2，提取文本的特征词，将文本进行分词，保存文本集的特征词表以及文本数量；

步骤3，计算文本中各特征词的词频，将文本用向量模型进行表示，并将文本集分为训练集和验证集两个部分；

步骤4，通过朴素贝叶斯分类器训练上一步生成的训练集向量模型，得出朴素贝叶斯模型的先验概率和特征类条件概率并保存；

步骤5，判断是否有新文本，若有，增量式训练新文本并更新朴素贝叶斯模型的先验概率和特征类条件概率，若没有则执行步骤6；

增量式训练新文本并更新朴素贝叶斯模型的先验概率和特征类条件概率的具体过程为：

步骤5-1，对新文本进行特征词提取，将特征词表中没有的特征词加入特征词表，并统计新文本总数M；

步骤5-2，计算文本中各特征词的词频，并将文本用向量模型进行表示；

步骤5-3，结合保存的朴素贝叶斯模型的先验概率π_j和特征类条件概率θ_i|j以及新文本T的向量模型使用增量式朴素贝叶斯更新方式更新参数得到新的先验概率π_j′和特征类条件概率θ_i|j′；所述增量式朴素贝叶斯更新方式为：

公式(1)中N_j和M_j分别表示在文本集S和新文本T在j类中的文本总数，1≤j≤C，C为文本类别数，在不重新训练文本集S的情况下N_j是未知的，通过N_j＝π_j*N还原得到；1≤k≤M，M为新文本总数；

公式(2)中和分别表示文本集S和新文本T在j类中的特征规模，其中V为特征词表的长度，I(y_k＝c_j)表示k文本的真实类别为c_j，N(t_i,x_k)表示k文本中第i个特征出现的次数；t_i为第i个特征，x_k为第k个文本的特征向量，y_k为第k个文本对应的类别标签；

通过特征规模缩放的方式得到：

加入平衡系数，包括通用平衡系数和每个类别的平衡系数两种方式：

λ为通用平衡系数，0λ1；

λ_j为第j个类别的平衡系数，0λ_j1；

步骤5-4，更新参数π_j＝π_j′和θ_i|j＝θ_i|j′，并且更新文本集S中文本总数N＝N+M；

步骤6，从验证集中选取测试语料，并根据朴素贝叶斯模型得到测试语料的预测文本类别，计算预测的准确率。

2.根据权利要求1所述的基于终生学习的增量式朴素贝叶斯文本分类方法，其特征在于，步骤3中将文本集分为训练集和验证集两个部分的具体过程为：采用五倍交叉验证方法，每次选取4份文本作为训练集，一份文本作为验证集。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京理工大学，未经南京理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201610983203.6/1.html，转载请声明来源钻瓜专利网。

上一篇：一种嵌套在窗户上的太阳能热水墙体
下一篇：自动切膜压膜起膜结构及振动结构施肥播种机

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top