[发明专利]意图识别方法有效
申请号: | 201910808616.4 | 申请日: | 2019-08-29 |
公开(公告)号: | CN111639152B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 陈怡;李小华;张琦;郭冬 | 申请(专利权)人: | 上海卓繁信息技术股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06N3/04;G06N3/08 |
代理公司: | 上海容慧专利代理事务所(普通合伙) 31287 | 代理人: | 于晓菁 |
地址: | 200030 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意图 识别 方法 | ||
1.一种意图识别方法,其特征在于,其包括以下步骤:
S1、对作为训练语料的去停用词后的待识别文本按照词级进行分割,分别利用两种量化模型对待识别文本进行文本量化;
S2、将分别量化后的待识别文本按照行拼接的方式得到更高维度的词向量;
S3、通过位置向量计算公式计算词向量以得到位置向量,将得到的位置向量与词向量相加得到中间向量;
S4、将中间向量作为编码器的第一层神经网络的输入,将第一层神经网络的输出和中间向量作为编码器的第二层神经网络的输入,将第二层神经网络的输出、第一层神经网络的输出和中间向量作为编码器的第三层神经网络的输入,得到第三层神经网络的最后时刻的输出向量;
S5、将第三层神经网络的最后时刻的输出向量与第三层神经网络的每一个时刻的输出向量做匹配计算得到每一个时刻的权重并将权重归一化,按照加权求和方式得到编码器的最终输出向量;
S6、将最终输出向量作为全连接层的输入以输出一行多列的数字向量;
S7、将数字向量作为分类器的输入以获得分类数字向量,从而分析出待识别文本的意图;
在步骤S7中,分类数字向量中的行列表示的是待识别文本与行列对应的类别意图的概率,并选取概率值最大的行列对应的类别意图作为待识别文本的意图。
2.如权利要求1所述的意图识别方法,其特征在于,在步骤S1中,两种量化模型为CBOW模型和TF-IDF模型。
3.如权利要求1所述的意图识别方法,其特征在于,在步骤S3中,位置向量计算公式为:
在i表示偶数时
在i表示奇数时
其中,i表示词向量位置,dmodel表示词向量的维度大小,pos表示待识别文本的句子长度,PE表示位置向量。
4.如权利要求1所述的意图识别方法,其特征在于,步骤S5中采用的公式为:
et=a(st-1,ht)
其中,St-1表示t-1时刻的状态,ht表示t时刻的隐藏层的输出,ct表示t时刻的输出向量,1≤t≤T,T表示正整数,et表示对状态做匹配计算,αt表示对匹配计算的结果作归一化。
5.如权利要求1所述的意图识别方法,其特征在于,编码器采用biGRU编码器。
6.如权利要求1所述的意图识别方法,其特征在于,分类器采用softmax分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海卓繁信息技术股份有限公司,未经上海卓繁信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910808616.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:文本相似度判别方法
- 下一篇:视频数据来源解析系统及方法