[发明专利]基于注意力机制和干扰词删除的中文文本分类方法有效
申请号: | 201911045593.2 | 申请日: | 2019-10-30 |
公开(公告)号: | CN112749274B | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 李芳芳;张盼曦;张健 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 长沙惟盛赟鼎知识产权代理事务所(普通合伙) 43228 | 代理人: | 马凤兰 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于注意力机制和干扰词删除的中文文本分类方法,包括步骤一对原始中文文本语料做预处理;步骤二将处理为词嵌入的语料输入双向LSTM层中提取文本特征得到文本表达;步骤三通过注意力机制提取重要词特征;步骤四将注意力机制标记出的重要词特征筛选排序;步骤五计算将预测结果切换到另一个类的异常干扰词,定位这种干扰词,做删除屏蔽的处理;步骤六用删除定量干扰词的方式调整训练分类器,并反向训练文本表达,得到训练参数;步骤七模型测试,将测试集词向量构成的词嵌入矩阵输入到训练好的模型中,得到概率矩阵后,输入分类器输出文本类别,最后与真实值比较得到预测值的精确度。本发明在提高中文文本分类的准确性的同时,评估删除屏蔽干扰词对分类的影响,增加了分类器的可解释性。 | ||
搜索关键词: | 基于 注意力 机制 干扰 删除 中文 文本 分类 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911045593.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于输送管道的输电方法和系统
- 下一篇:一种用于管道输电的输送管道