[发明专利]基于深度学习的文本分类方法在审
申请号: | 202011099764.2 | 申请日: | 2020-10-14 |
公开(公告)号: | CN112163064A | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 刘云翔;徐齐;原鑫鑫;王春娅 | 申请(专利权)人: | 上海应用技术大学 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200235 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 文本 分类 方法 | ||
1.一种基于深度学习的文本分类方法,其特征在于,包括:
步骤1:对带文本标签的文本数据进行清洗,然后将清洗后的带标签的文本数据划分为训练数据集和验证集;
步骤2:将训练数据集合和验证集的文本中的单词替换成单词编号,以分别形成训练数据集合对应的单词索引序列和验证集对应的单词索引序列;
步骤3:构建词向量矩阵;
步骤4:基于所述词向量矩阵,将分别将训练数据集和验证集对应的单词索引序列映射为训练数据集和验证集对应的词向量序列S;
步骤5:将训练数据集对应的词向量序列S输入多注意力神经网络模型,以获取输出的文本向量Sw;
步骤6:将所述文本向量Sw输入到前馈神经网络中,以获取输出的文本类别概率向量;
步骤7:基于所述文本数据的文本标签得到文本标签向量,根据所述文本类别概率向量和文本标签向量,计算损失函数,并使用批量梯度下降算法优化所述损失函数,基于优化后的损失函数对注意力神经网络和前馈神经网络的模型参数进行调整,以得到优化后的模型;
步骤8:将验证集对应的词向量序列S输入所述优化后的模型,基于所述优化后的模型的输出选取最优的模型作为最终的模型;
步骤9:基于所述最终的模型对待分类的文本进行分类。
2.如权利要求1所述的基于深度学习的文本分类方法,其特征在于,对带文本标签的文本数据进行清洗,包括:
去除多余的符号,只保留标点符号、单词,并将文本标签用one-hot向量表示。
3.如权利要求1所述的基于深度学习的文本分类方法,其特征在于,步骤2:将训练数据集合和验证集的文本中的单词替换成单词编号,包括:
按照训练数据集中单词出现的频率分别为训练数据集中的单词进行编号,将训练数据集的文本中的单词替换成单词编号,其中,对于训练数据集中的前num个频率最高的单词,单词编号为该单词出现的频率对应的编号;对于编号大于num的单词,单词编号为0,num为正整数;
按照验证集中单词出现的频率分别为验证集中的单词进行编号,将验证集的文本中的单词替换成单词编号,其中,对于验证集中的前num个频率最高的单词,单词编号为该单词出现的频率对应的编号;对于编号大于num的单词,单词编号为0。
4.如权利要求3所述的基于深度学习的文本分类方法,其特征在于,构建词向量矩阵,包括:
使用glove预训练词向量或者Word2Vec工具,分别获取训练数据集和验证集中的单词对应的维度为dim的词向量,其中,dim为正整数;
基于训练数据集中的单词对应的维度为dim的词向量,构建训练数据集对应的维度为num*dim的词向量矩阵;
基于训练验证集中的单词对应的维度为dim的词向量,构建训练数据集对应的维度为num*dim的词向量矩阵。
5.如权利要求1所述的基于深度学习的文本分类方法,其特征在于,步骤4:基于所述词向量矩阵,将分别将训练数据集和验证集对应的单词索引序列映射为训练数据集和验证集对应的词向量序列S,包括:
基于所述训练数据集对应的词向量矩阵,并使用词向量初始化模型Embedding层,将训练数据集输入Embedding层,以得到训练数据集对应的词向量序列S;
基于所述验证集对应的词向量矩阵,并使用词向量初始化模型Embedding层,将验证集对应的单词索引序列输入Embedding层,以得到验证集对应的词向量序列S。
6.如权利要求1所述的基于深度学习的文本分类方法,其特征在于,步骤5:将训练数据集对应的词向量序列S输入多注意力神经网络模型,以获取输出的文本向量Sw,
将训练数据集对应的词向量序列S输入多注意力神经网络中,利用词注意力网络学习单词间依赖关系得到文本向量S1;
利用局部注意力网络学习局部依赖关系得到向量S2;
最后将S1和S2输入到交叉注意力网络中学习局部与单词间的依赖关系得到文本向量Sw。
7.如权利要求1所述的基于深度学习的文本分类方法,其特征在于,步骤7中,所述损失函数计算公式为:
其中,批量大小batch-size=128,y为文本标签,为类别概率向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海应用技术大学,未经上海应用技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011099764.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于高光谱成像的多生理参数检测装置及方法
- 下一篇:一种公路施工夯实设备