[发明专利]一种中文请求文本意图分析方法在审
申请号: | 202011463898.8 | 申请日: | 2020-12-11 |
公开(公告)号: | CN112446219A | 公开(公告)日: | 2021-03-05 |
发明(设计)人: | 刘光毅 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F40/242;G06N3/04 |
代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 刘兴亮 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中文 请求 文本 意图 分析 方法 | ||
1.一种中文请求文本意图分析方法,其特征在于,包括以下步骤:
步骤1,用户数据处理,动词词典构造,意图目录构造;
步骤2,分词、Word2vec词向量训练,构造词汇表;
步骤3,IDCNN学习训练;
步骤4,注意力机制调整权重;
步骤5,对有表达明显意图的动词关键词作为判断关键,加入规则辅助判断预测结果,输出对用户请求的意图判断。
2.如权利要求1所述的一种中文请求文本意图分析方法,其特征在于,所述步骤1中,收集MUSIC相关汉语动词构造词典,由意图种类构建意图目录;从电视端采集用户在MUSIC领域的请求数据,结合音乐评论、KTV评论相关网页评论中含有表达意图的评论,筛选后作为原始数据集,分别收集不同意图的文本储存于不同文件中,人工给数据集标注意图。
3.如权利要求1所述的一种中文请求文本意图分析方法,其特征在于,所述步骤2中,将步骤1中清洗的数据分词后,构建相应词汇变,通过Word2vec训练64维的词向量;
将数据通过分词系统有效分成完整实体的词汇,再由此构建大小为5000的词汇表。
4.如权利要求1所述的一种中文请求文本意图分析方法,其特征在于,所述步骤3中,将短文本采用词向量表示之后,构建膨胀卷积神经网络,输入单元X={x1,x2,...,xt},其中每个xi(i=1,2,...,t)为词向量,隐含层包含前向传播层和后向传播层。
5.如权利要求1所述的一种中文请求文本意图分析方法,其特征在于,所述步骤4中,在IDCNN的基础上,加入注意力机制,对卷积网络生成的特征输出,从通道和空间两个维度计算其注意力attention,然后将其与输入的特征相乘来进行特征的自适应学习。
6.如权利要求5所述的一种中文请求文本意图分析方法,其特征在于,使用最大池化和平均池化对IDCNN中间层的输出特征在空间唯独上进行压缩,得到两个不同的背景描述:和使用由MLP组成的共享网络对这两个不同的空间背景描述进行计算得到调整后的特征:
最后,W0用Relu作为激活函数;
使用最大池化和平均池化得到两个不同的特征描述:和将两个特征描述结合,并使用卷积操作生成spatial attention map:Ms(F)
f7*7表示7×7的卷积层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011463898.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:控水结构及加湿器
- 下一篇:一种面向客户服务的企业知识库管理方法