[发明专利]基于卷积神经网络的文本分类方法、装置、介质和设备有效
申请号: | 201811132614.X | 申请日: | 2018-09-27 |
公开(公告)号: | CN109543029B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 金戈;徐亮;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/0464 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 黄耀威 |
地址: | 518000 广东省深圳市福田街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 神经网络 文本 分类 方法 装置 介质 设备 | ||
1.一种基于卷积神经网络的文本分类方法,其特征在于,包括:
获取与网络舆情相关的待分类文本,确定所述待分类文本的词向量矩阵;
根据所述词向量矩阵构造初始特征矩阵;
构建初始模型,所述初始模型包括依次连接的区域块和与所有区域块输出端连接的全连接层,全连接层的输出为所述初始模型的输出;
获取词向量预设矩阵,通过将所述词向量预设矩阵作为所述初始模型的输入、将相应分类预设结果作为所述初始模型的输出,对所述初始模型进行训练,确定所述初始模型的模型参数,将确定模型参数的初始模型作为文本分类模型;
将所述初始特征矩阵作为训练后的文本分类模型的输入,所述文本分类模型包括依次连接的区域块和与所有区域块输出端连接的全连接层,所述全连接层的输出为所述文本分类模型的输出;
将所述文本分类模型的输入作为第一顺位的区域块的输入;
预设所述区域块内所有隐含层的处理序列;
根据所述区域块的输入确定所述处理序列中第一顺位的隐含层的输出,之后按照所述处理序列、根据所述区域块的输入和已经确定输出的之前的隐含层的输出依次确定每个隐含层的输出;
按照所述处理序列、根据更新公式依次确定每个隐含层的输出;所述更新公式为:
;
其中,表示所述处理序列中第i个隐含层在第k次更新后的输出,表示激活函数,表示卷积运算;表示第m个隐含层与第i个隐含层之间的权重,表示第m个隐含层在第k次更新后的输出,表示第n个隐含层与第i个隐含层之间的权重,表示第n个隐含层在第k-1次更新后的输出;且当k=1时,第k-1次更新表示未更新;
在更新预设次数后,将所述处理序列中最后顺位的隐含层更新后的输出作为所述区域块的输出;所述区域块包含多个隐含层,且每个隐含层的输入来自于所述区域块内所有其他隐含层的输出;
将当前区域块的输出作为下一个区域块的输入,继续确定下一个区域块的输出,直至确定所有区域块的输出,并将所有区域块的输出传至全连接层;
所述文本分类模型的全连接层根据所有区域块的输出确定所述待分类文本的分类结果。
2.根据权利要求1所述的方法,其特征在于,所述确定所述待分类文本的词向量矩阵包括:
依次将所述待分类文本中的每个词转换为词向量,并将所述待分类文本的一个句子中所有词向量顺序拼接形成相应的句子序列;
对所有的所述句子序列进行尾部补零处理,尾部补零处理后的句子序列具有相同的序列长度;
依次将所有的尾部补零处理后的句子序列作为矩阵的一行或一列,生成所述待分类文本的词向量矩阵。
3.根据权利要求1或2所述的方法,其特征在于,所述将当前区域块的输出作为下一个区域块的输入包括:
对当前区域块的输出进行池化处理,确定当前区域块的特征量,所述特征量为1×1×C的向量,其中,C为当前区域块的输出的通道个数;
根据当前区域块的特征量调整当前区域块的输出,将调整后的当前区域块的输出作为下一个区域块的输入。
4.根据权利要求1或2所述的方法,其特征在于,所述将所有区域块的输出传至全连接层包括:
将所有区域块的输入和输出均传至全连接层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811132614.X/1.html,转载请声明来源钻瓜专利网。