[发明专利]意图识别方法、装置、对话机器人和计算机可读存储介质在审
申请号: | 202010966550.4 | 申请日: | 2020-09-15 |
公开(公告)号: | CN112115702A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 郑悦;江丹丹;景艳山 | 申请(专利权)人: | 北京明略昭辉科技有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/284;G06N3/04;G06N3/08 |
代理公司: | 青岛清泰联信知识产权代理有限公司 37256 | 代理人: | 赵燕 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意图 识别 方法 装置 对话 机器 人和 计算机 可读 存储 介质 | ||
1.一种意图识别方法,其特征在于,包括:
待识别文本获取步骤,用于获取一待识别文本并设置候选意图,所述候选意图个数为N;
向量表示步骤,用于经一文本转换器将所述待识别文本中每一字转换为相应的字向量后,通过一双向循环神经网络及池化层对所述字向量进行特征提取、池化得到所述待识别文本的句向量,并经一复合线性层将所述句向量的维度转换为N,得到一N维句向量;
归一化步骤,用于将所述N维句向量经一Softmax层进行归一化处理,从而识别得到每一候选意图及其概率;
其中,所述N为自然数。
2.如权利要求1所述的意图识别方法,其特征在于,所述方法进一步包括:
结果输出步骤,用于选取所述候选意图中概率最高的候选意图作为识别结果。
3.如权利要求2所述的意图识别方法,其特征在于,所述向量表示步骤进一步包括:
字向量获取步骤,用于经一文本转换器将所述待识别文本映射为对应的字向量,具体的,所述文本转换器包括但不限于ALBERT模型、XLNET模型、ERINE模型;
句向量获取步骤,用于经所述双向循环神经网络获取所述字向量的前向信息向量和后向信息向量并将二者拼接为一特征向量,再经一池化层对所述特征向量进行池化,池化后的所述特征向量为所述待识别文本的句向量;
向量维度转换步骤,用于经一复合线性层将所述句向量转换为所述N维向量。
4.如权利要求3所述的意图识别方法,其特征在于,所述句向量获取步骤中,所述双向循环神经网络采用但不限于双向GRU网络。
5.如权利要求3所述的意图识别方法,其特征在于,所述池化层进一步包括:最大池化层Max Pooling、平均池化层Avg Pooling,用于对所述特征向量中每一列分别取最大值和平均值,得到二池化后的特征向量后,并经拼接二所述池化后的特征向量得到所述句向量。
6.如权利要求2所述的意图识别方法,其特征在于,所述复合线性层至少包括:Dropout层、批标准化层、激活函数其一或其任意组合。
7.一种意图识别装置,其特征在于,用于实现如权利要求1至6中任一项所述的意图识别方法,所述装置包括:
待识别文本获取模块,用于获取一待识别文本并设置候选意图,所述候选意图个数为N;
向量表示模块,用于经一文本转换器将所述待识别文本中每一字转换为响应的字向量后,通过一双向循环神经网络及池化层对所述字向量进行特征提取、池化得到所述待识别文本的句向量,并经一复合线性层将所述句向量的维度转换为N,得到一N维句向量;
归一化模块,用于将所述N维句向量经一Softmax层进行归一化处理,从而识别得到每一候选意图及其概率,
其中,所述N为自然数。
8.一种对话机器人,其特征在于,至少包括:
一预处理模块,用于接收语音信号并将接收的语音信号输出为文本;
一意图识别模块,用于接收所述预处理模块输出的文本并基于如权利要求1至6中任一项所述的意图识别方法进行识别,得到至少一候选意图;及
一对话管理模块,用于获取至少一所述候选意图并根据所述候选意图返回一应答信号。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的意图识别方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至6中任一项所述的意图识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略昭辉科技有限公司,未经北京明略昭辉科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010966550.4/1.html,转载请声明来源钻瓜专利网。