[发明专利]一种基于联合训练模型的自动对话方法和系统在审
申请号: | 202010574503.5 | 申请日: | 2020-06-22 |
公开(公告)号: | CN111737432A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 饶璐;周兴发;孙锐 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F40/284;G06N3/04;G06N3/08;G06N7/02 |
代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 胡慧东 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 联合 训练 模型 自动 对话 方法 系统 | ||
1.一种基于联合训练模型的自动对话方法,其特征在于:包括以下步骤:
获取用户输入问句;
将所述问句转化为词向量;
构建基于胶囊神经网络的意图识别和槽位填充联合模型,并完成模型的训练;
将所述词向量输入所述联合模型中,输出用户意图及槽位标签;
根据对话管理框架,判断所述用户意图下的所有槽位是否被槽位标签填充完毕,若无,通过对话管理框架补全槽位;
将所述用户意图及槽位信息输入知识图谱,通过模糊匹配的搜索算法匹配出相应路径,输出相应答案。
2.根据权利要求1所述的一种基于联合训练模型的自动对话方法,其特征在于:将所述问句转化为词向量的方法,包括:随机生成的词向量表示方法,或基于深度学习的语言模型训练得到的向量表示方法。
3.根据权利要求1所述的一种基于联合训练模型的自动对话方法,其特征在于:所述联合模型包括:构建三个子胶囊模块,分别为词胶囊模块、槽位胶囊模块和意图胶囊模块,各个模块之间通过动态路径连接。
4.根据权利要求3所述的一种基于联合训练模型的自动对话方法,其特征在于:所述动态路径通过路由协议执行;
所述词胶囊模块由多层长短期记忆模型循环神经网络构成,以学习输入问句中每个单词的上下文关系;
在所述词胶囊模块后接入所述槽位胶囊模块,将所述词胶囊模块的长短期记忆模型循环神经网络层输出传入所述槽位胶囊模块的挤压函数,并通过动态路径的路由协议对所述挤压函数参数进行更新;
在所述槽位胶囊模块后接入所述意图胶囊模块,所述意图胶囊模块包含多个全连接层,通过动态路由协议对全连接层中的参数进行更新。
5.根据权利要求4所述的一种基于联合训练模型的自动对话方法,其特征在于:处于更高阶的槽位胶囊模块和意图胶囊模块在学习到低阶的词胶囊模块传递过来的特征后,通过路径更新将学习后的特征重新传递给位于低阶的词胶囊模块,以实现各模块之间的信息传递。
6.根据权利要求3所述的一种基于联合训练模型的自动对话方法,其特征在于:构建基于胶囊神经网络的意图识别和槽位填充联合模型之后,还包括:迭代更新所述联合模型参数的方法,所述迭代更新联合模型参数的方法采用最大间隔损失函数对所述联合模型参数进行优化。
7.根据权利要求3所述的一种基于联合训练模型的自动对话方法,其特征在于:所述模型的训练包含获取语料数据,对所述语料数据进行意图和槽位的标注,将所述标注后的语料数据进行词向量的转换,将所述词向量输入基于胶囊神经网络的意图识别和槽位填充联合模型中进行训练,得到训练好的基于胶囊神经网络的联合模型。
8.根据权利要求1所述的一种基于联合训练模型的自动对话方法,其特征在于:通过所述基于胶囊神经网络的联合训练模型得到用户意图和槽位标签,判断所述用户意图下的槽位信息是否填充完整,若槽位信息填充不完整,返回预设问句以获取相应缺失的槽位信息。
9.根据权利要求1所述的一种基于联合训练模型的自动对话方法,其特征在于:将所述意图及所述槽位信息输入知识图谱,通过模糊匹配的搜索算法匹配出相应路径,输出相应答案之前,还包括:建立搜索算法以找到与所述意图和槽位信息相匹配的知识图谱路径。
10.一种基于联合训练模型的自动对话系统,其特征在于,包括:
问句获取单元,获取用户输入问句;
词向量转换单元,将所述问句转化为词向量;
模型构建单元,构建基于胶囊神经网络的意图识别和槽位填充联合模型,并完成模型的训练;
识别单元,将所述词向量输入所述基于胶囊神经网络的联合模型中,输出用户意图及槽位标签;
对话管理单元,根据对话管理框架,判断所述用户意图下的所有槽位是否被槽位标签填充完毕,若无,通过对话管理框架补全槽位;
搜索单元,将所述用户意图及槽位信息输入知识图谱,通过模糊匹配的搜索算法匹配出相应路径,输出相应答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010574503.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于多源数据的空间网格化干旱灾情风险评估方法及系统
- 下一篇:一种航空激光器