[发明专利]一种文本分类方法及装置有效
申请号: | 201811275675.1 | 申请日: | 2018-10-30 |
公开(公告)号: | CN111199155B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 王超;李修鹏;田文宝;赵欣莅;赵东伟;张志朋;樊锐强;刘庆标;尹学正;温连魁 | 申请(专利权)人: | 飞狐信息技术(天津)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06F40/289;G06N3/0464;G06N3/0442;G06N3/045;G06N3/084 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 300280 天津市经济技术开发区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 分类 方法 装置 | ||
1.一种文本分类方法,其特征在于,包括:
将目标文本拆分为多个短语,并将每个短语拆分为多个单词;
基于多维度卷积神经网络模型,分别将目标文本中每个短语转化为相应的短语语义表示向量,其中,每个短语包括多个以词嵌入向量进行语义表示的单词;
将所述目标文本中每个所述短语语义表示向量输入到多粒度长短期记忆模型中进行处理,将所述多粒度长短期记忆模型中每个隐含层的输出向量的平均值确定为所述目标文本的分层语义向量;
将所述目标文本的分层语义向量输入到分类模型中进行分类处理,得到所述目标文本在预设类型集合中的概率分布,将最大概率值对应的类型作为所述目标文本的类型;
其中,所述基于多维度卷积神经网络模型,分别将目标文本中每个短语转化为相应的短语语义表示向量,包括:
分别对目标文本中每个短语对应的多个词嵌入向量进行串联,得到所述目标文本中每个短语的串联向量,其中,目标文本中每个短语中单词的数量值与多维度卷积神经网络模型的卷积核窗口宽度值相同;
分别将所述目标文本中每个短语的串联向量输入到所述多维度卷积神经网络模型中进行处理,对卷积层的输出向量执行平均采样,得到池化层的输入向量,并对池化层的输出向量执行平均折叠,生成所述目标文本中每个短语对应的短语语义表示向量。
2.根据权利要求1所述的方法,其特征在于,所述将所述目标文本中每个所述短语语义表示向量输入到多粒度长短期记忆模型中进行处理,包括:
将所述目标文本中每个所述短语语义表示向量输入到多粒度长短期记忆模型中进行处理,得到第一个隐含层的输出向量;
对于除第一个隐含层之外的每个隐含层,对该隐含层对应的输入向量和上一个隐含层的输出向量进行非相关遗忘操作和相关更新操作,得到每个隐含层的输出向量。
3.根据权利要求1所述的方法,其特征在于,在所述基于多维度卷积神经网络模型,分别将目标文本中每个短语转化为相应的短语语义表示向量之前,所述方法还包括:
构建训练集、测试集和词向量矩阵;
对多维度卷积神经网络模型、多粒度长短期记忆模型和分类模型的参数进行初始化;
根据所述训练集对多维度卷积神经网络模型、多粒度长短期记忆模型和分类模型进行训练,并利用反向传播算法调节多维度卷积神经网络模型、多粒度长短期记忆模型和分类模型的参数、以及所述词向量矩阵;
利用所述测试集对训练后的多维度卷积神经网络模型、多粒度长短期记忆模型和分类模型进行测试,并当测试结果满足文本分类的准确度要求时停止训练。
4.一种文本分类装置,其特征在于,包括:
目标文本拆分单元,用于将目标文本拆分为多个短语,并将每个短语拆分为多个单词;
短语语义表示单元,用于基于多维度卷积神经网络模型,分别将目标文本中每个短语转化为相应的短语语义表示向量,其中,每个短语包括多个以词嵌入向量进行语义表示的单词;
分层语义表示单元,用于将所述目标文本中每个所述短语语义表示向量输入到多粒度长短期记忆模型中进行处理,将所述多粒度长短期记忆模型中每个隐含层的输出向量的平均值确定为所述目标文本的分层语义向量;
分类处理单元,用于将所述目标文本的分层语义向量输入到分类模型中进行分类处理,得到所述目标文本在预设类型集合中的概率分布,将最大概率值对应的类型作为所述目标文本的类型;
其中,所述短语语义表示单元,具体用于分别对目标文本中每个短语对应的多个词嵌入向量进行串联,得到所述目标文本中每个短语的串联向量,其中,目标文本中每个短语中单词的数量值与多维度卷积神经网络模型的卷积核窗口宽度值相同;分别将所述目标文本中每个短语的串联向量输入到所述多维度卷积神经网络模型中进行处理,对卷积层的输出向量执行平均采样,得到池化层的输入向量,并对池化层的输出向量执行平均折叠,生成所述目标文本中每个短语对应的短语语义表示向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于飞狐信息技术(天津)有限公司,未经飞狐信息技术(天津)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811275675.1/1.html,转载请声明来源钻瓜专利网。