[发明专利]意图识别方法有效
申请号: | 201910808616.4 | 申请日: | 2019-08-29 |
公开(公告)号: | CN111639152B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 陈怡;李小华;张琦;郭冬 | 申请(专利权)人: | 上海卓繁信息技术股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06N3/04;G06N3/08 |
代理公司: | 上海容慧专利代理事务所(普通合伙) 31287 | 代理人: | 于晓菁 |
地址: | 200030 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意图 识别 方法 | ||
一种意图识别方法包括:对去停用词后的待识别文本按照词级分割,分别利用两种量化模型对待识别文本进行文本量化;将待识别文本按照行拼接得到词向量;计算词向量以得到位置向量,将位置向量与词向量相加得到中间向量;中间向量作为第一层神经网络输入,第一层神经网络输出和中间向量作为第二层神经网络输入,第二和第一层神经网络输出及中间向量作为第三层神经网络输入,得到第三层神经网络最后时刻输出向量;最后时刻输出向量与每一个时刻的输出向量匹配计算得到每一个时刻的权重并将权重归一化,加权求和得到最终输出向量;最终输出向量作为全连接层的输入以输出数字向量;数字向量作为分类器的输入以获得分类数字向量分析出待识别文本的意图。
技术领域
本发明涉及意图识别技术领域,特别是涉及一种意图识别方法。
背景技术
在人机对话领域,用户意图识别有着重要的作用。现有的意图分类方法主要是基于传统的规则方法和深度学习两种,前者对文本特征提取过多的依赖人为的经验,而后者由于其在较好的表现,在自然语言处理领域有着广泛引用。在意图识别中,具有代表性的有基于rnn和cnn结构的意图分类模型,这些模型的因为其特征提取不全,导致用户意图识别效果欠佳。
发明内容
本发明针对现有技术存在的问题和不足,提供一种新型的意图识别方法。
本发明是通过下述技术方案来解决上述技术问题的:
本发明提供一种意图识别方法,其特点在于,其包括以下步骤:
S1、对作为训练语料的去停用词后的待识别文本按照词级进行分割,分别利用两种量化模型对待识别文本进行文本量化;
S2、将分别量化后的待识别文本按照行拼接的方式得到更高维度的词向量;
S3、通过位置向量计算公式计算词向量以得到位置向量,将得到的位置向量与词向量相加得到中间向量;
S4、将中间向量作为编码器的第一层神经网络的输入,将第一层神经网络的输出和中间向量作为编码器的第二层神经网络的输入,将第二层神经网络的输出、第一层神经网络的输出和中间向量作为编码器的第三层神经网络的输入,得到第三层神经网络的最后时刻的输出向量;
S5、将第三层神经网络的最后时刻的输出向量与第三层神经网络的每一个时刻的输出向量做匹配计算得到每一个时刻的权重并将权重归一化,按照加权求和方式得到编码器的最终输出向量;
S6、将最终输出向量作为全连接层的输入以输出一行多列的数字向量;
S7、将数字向量作为分类器的输入以获得分类数字向量,从而分析出待识别文本的意图。
较佳地,在步骤S1中,两种量化模型为CBOW模型和TF-IDF模型。
较佳地,在步骤S3中,位置向量计算公式为:
在i表示偶数时
在i表示奇数时
其中,i表示词向量位置,dmodel表示词向量的维度大小,pos表示待识别文本的句子长度,PE表示位置向量。
较佳地,步骤S5中采用的公式为:
et=a(st-1,ht)
其中,ti-1表示i-1时刻的状态,hi表示i时刻的隐藏层的输出,ci表示i时刻的输出向量,1≤t≤T,T表示正整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海卓繁信息技术股份有限公司,未经上海卓繁信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910808616.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:文本相似度判别方法
- 下一篇:视频数据来源解析系统及方法