[发明专利]一种用户意图识别方法、装置、计算机设备及存储介质在审
申请号: | 201910008318.7 | 申请日: | 2019-01-04 |
公开(公告)号: | CN109858022A | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 王健宗;程宁;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 黄章辉 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户意图 目标文本 预设 循环神经网络 计算机设备 概率 存储介质 目标结果 目标向量 向量 目标用户 向量化 输出 应用 学习 | ||
1.一种用户意图识别方法,其特征在于,包括:
获取待识别意图的目标文本;
对所述目标文本进行向量化处理,得到目标向量;
将所述目标向量作为输入投入至预先训练好的循环神经网络,得到所述循环神经网络输出的目标结果向量,所述目标结果向量中的各个元素分别为各个预设用户意图对应的第一概率值,第一概率值表征了所述目标文本属于对应的预设用户意图的概率;
将第一概率值最高的预设用户意图确定为所述目标文本对应的目标用户意图。
2.根据权利要求1所述的用户意图识别方法,其特征在于,所述循环神经网络通过以下步骤预先训练好:
分别收集属于各个预设用户意图的话术文本;
对收集到的话术文本分别进行向量化处理,得到各个话术文本对应的样本向量;
针对每个预设用户意图,将所述预设用户意图对应的样本向量的标记值记为1,其它样本向量的标记值记为0;
针对每个预设用户意图,将所有样本向量作为输入投入至循环神经网络进行训练,得到样本结果向量,每个样本结果向量中的各个元素分别表征所述样本向量对应的话术文本分别属于各个预设用户意图的概率;
针对每个预设用户意图,以输出的各个样本结果向量作为调整目标,调整所述循环神经网络的参数,以最小化得到的所述各个样本结果向量与各个样本向量对应的标记值之间的误差;
若所述各个样本结果向量与各个样本向量对应的标记值之间的误差满足预设的训练终止条件,则确定所述循环神经网络已训练好。
3.根据权利要求2所述的用户意图识别方法,其特征在于,所述针对每个预设用户意图,将所有样本向量作为输入投入至循环神经网络进行训练,得到样本结果向量包括:
每个样本向量输入到所述循环神经网络训练时,将所述每个样本向量投入到双向GRU网络中,获取所述双向GRU网络的输出序列,然后使用预设尺寸的卷积窗口提取所述输出序列的特征,得到卷积结果,对卷积结果进行平均池化操作和最大池化操作后得到池化操作结果,聚合所有池化操作结果并输入所述循环神经网络的全连接层得到样本结果向量。
4.根据权利要求3所述的用户意图识别方法,其特征在于,所述将所述目标向量作为输入投入至预先训练好的循环神经网络,得到所述循环神经网络输出的目标结果向量包括:
在将所述目标向量输入所述循环神经网络之后,获取所述双向GRU网络的输出序列,然后使用所述卷积窗口提取输出序列的特征,得到卷积结果,对卷积结果进行平均池化操作和最大池化操作后得到池化操作结果,聚合所有池化操作结果并输入所述循环神经网络的全连接层得到目标结果向量。
5.根据权利要求1至4中任一项所述的用户意图识别方法,其特征在于,所述对所述目标文本进行向量化处理,得到目标向量包括:
采用预设的字典将所述目标文本中各个字词转化为各个一维行向量,所述字典记录了字词与各个一维行向量之间的对应关系;
按照所述目标文本中各个字词的次序将所述各个一维行向量组成一个二维向量作为目标向量。
6.一种用户意图识别装置,其特征在于,包括:
目标文本获取模块,用于获取待识别意图的目标文本;
文本向量化模块,用于对所述目标文本进行向量化处理,得到目标向量;
向量输入模块,用于将所述目标向量作为输入投入至预先训练好的循环神经网络,得到所述循环神经网络输出的目标结果向量,所述目标结果向量中的各个元素分别为各个预设用户意图对应的第一概率值,第一概率值表征了所述目标文本属于对应的预设用户意图的概率;
意图确定模块,用于将第一概率值最高的预设用户意图确定为所述目标文本对应的目标用户意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910008318.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:业务问题统计方法、装置、计算机设备及其存储介质
- 下一篇:一种语句纠错装置