首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]文本分类方法、装置、存储介质和计算机设备在审

申请号：	201810387343.6	申请日：	2018-04-26
公开（公告）号：	CN110209805A	公开（公告）日：	2019-09-06
发明（设计）人：	王振飞;范欣;赵铭;徐聪;张伟	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06F16/35	分类号：	G06F16/35;G06F17/27
代理公司：	广州华进联合专利商标代理有限公司 44224	代理人：	李文渊;邓云鹏
地址：	518000 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	概率分布向量待分类文本文本分类词向量计算机设备存储介质概率分布特征向量词集合非线性变化分类类别分类文本线性变化向量化分类分词申请
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种文本分类方法，包括：

将待分类文本进行分词，得到词集合；

向量化所述词集合中的各词，得到各所述词各自对应的词向量；

根据对各词向量进行线性变化得到的第一特征向量，得到第一概率分布向量；所述第一概率分布向量表示待分类文本属于各分类类别的第一概率分布；

根据对各词向量进行非线性变化得到的第二特征向量，得到第二概率分布向量；所述第二概率分布向量表示待分类文本属于各分类类别的第二概率分布；

通过所述第一概率分布向量与所述第二概率分布向量，确定所述分类文本所属的分类类别。

2.根据权利要求1所述的方法，其特征在于，所述向量化所述词集合中的各词，得到各所述词各自对应的词向量，包括：

确定所述词集合中各词相应的文本特征和词性特征；

根据所述文本特征和所述词性特征向量化相应词，得到各所述词各自对应的词向量。

3.根据权利要求1所述的方法，其特征在于，所述根据对各词向量进行线性变化得到的第一特征向量，得到第一概率分布向量，包括：

将各所述词向量输入第一文本分类模型，在所述第一文本分类模型的隐层中，对各所述词向量进行线性变化得到第一特征向量；

通过所述第一文本分类模型的分类层对所述第一特征向量进行分类，输出与所述待分类文本所对应的第一概率分布向量。

4.根据权利要求3所述的方法，其特征在于，所述第一文本分类模型为快速文本分类模型；

所述将各所述词向量输入第一文本分类模型，在所述第一文本分类模型的隐层中，对各所述词向量进行线性变化得到第一特征向量，包括：

将各所述词向量输入快速文本分类模型，在所述快速文本分类模型的隐层中，对各所述词向量进行加权平均运算，得到第一特征向量。

5.根据权利要求1所述的方法，其特征在于，所述根据对各词向量进行非线性变化得到的第二特征向量，得到第二概率分布向量，包括：

将各所述词向量输入第二文本分类模型，在所述第二文本分类模型的隐层中，对各所述词向量进行非线性变化得到第二特征向量；

通过所述第二文本分类模型的分类层对所述第二特征向量进行分类，输出与所述待分类文本所对应的第二概率分布向量。

6.根据权利要求5所述的方法，其特征在于，所述第二文本分类模型为神经网络模型；

所述将各所述词向量输入第二文本分类模型，在所述第二文本分类模型的隐层中，对各所述词向量进行非线性变化得到第二特征向量，包括：

将各所述词向量输入神经网络模型，通过所述神经网络模型中卷积层的多个卷积核对各所述词向量进行卷积运算，得到每个卷积核输出的中间特征向量；

通过所述神经网络模型的池化层对各所述中间特征向量进行池化运算，得到每个中间特征向量所对应的特征标量，并将包括各所述特征标量的第二特征向量传输至所述神经网络模型的分类层。

7.根据权利要求1-6中任一项所述的方法，其特征在于，所述待分类文本包括文本正文和文本标题；所述方法还包括：

获取各分类类别相应的关键词集合；

计算每个所述关键词集合中的关键词与文本标题所包括的词的相关度，得到相应分类类别所对应的相关度；

将每个分类类别所对应的相关度中的最大相关度，作为所述文本标题与该分类类别的类别相关度，并根据各所述类别相关度生成类别相关度向量；

所述通过所述第一概率分布向量与所述第二概率分布向量，确定所述分类文本所属的分类类别，包括：

通过所述第一概率分布向量、所述第二概率分布向量以及所述类别相关度向量，确定所述分类文本所属的分类类别。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于腾讯科技（深圳）有限公司，未经腾讯科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810387343.6/1.html，转载请声明来源钻瓜专利网。

上一篇：目标语料的确定方法和装置、存储介质及电子装置
下一篇：文本分类方法、文本分类装置及计算机可读存储介质

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top