[发明专利]完全并行化具有领域扩展性的端到端多轮对话系统及方法有效
申请号: | 201910411706.X | 申请日: | 2019-05-17 |
公开(公告)号: | CN110196928B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 鄂海红;宋美娜;陈忠富;牛佩晴;周筱松;程瑞;肖思琪 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F16/9032 | 分类号: | G06F16/9032;G06K9/62;G06N3/04 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 100876 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 完全 并行 具有 领域 扩展性 端到端多 轮对 系统 方法 | ||
1.一种完全并行化具有领域扩展性的端到端多轮对话系统,其特征在于,包括:
输入嵌入层,用于在用户输入信息输入至所述输入嵌入层后,生成向量表示形式的输入信息;
编码器,用于对所述向量表示形式的输入信息进行编码,得到用户输入的抽象表示;
对话状态解码器,用于根据所述抽象表示得到对话状态表示;
数据库,用于根据所述对话状态表示查询得到查询结果;以及
机器响应解码器,用于在所述查询结果和对话状态共同输入至机器响应解码器后,生成机器回答;
所述编码器由第一多层卷积神经网络和自注意力网络组成,其中,在每一层卷积神经网络之后,添加一个GLU网络,并在所述多层卷积神经网络之间应用残差网络,以提取用户输入的局部特征,并且使用所述自注意力网络捕获句子的全局依赖;
所述对话状态解码器由第二多层卷积神经网络和多跳注意力机制组成,所述第二多层卷积神经网络用于提取局部特征,所述多跳注意力机制结合深层特征高度抽象和浅层特征真实的优势,以从各层特征中获取相关信息,以为每层卷积网络添加单独的注意力机制;
所述机器响应解码器由卷积神经网络和多跳注意力机制组成,所述卷积神经网络用于提取局部特征,所述多跳注意力机制结合深层特征高度抽象和浅层特征真实的优势,以从各层特征中获取有益信息。
2.根据权利要求1所述的系统,其特征在于,所述编码器的输出为:
Yenc=Enc(InputEmb(utrt-1)),
其中,Enc表示编码器,InputEmb表示输入嵌入层,ut表示当前轮的用户输入,rt-1表示上一轮的机器响应。
3.根据权利要求1所述的系统,其特征在于,其中,
其中,αij为解码器向量在编码器向量的注意力,eij为和的对齐分数,eik为和的对齐分数,Tx为编码器输入序列的总长度,n为0.5,W1为线性层参数,为解码器的第i个语义向量,b1为线性层参数,gi为解码器的词向量经过一个线性层的输出,ci为上下文向量,为最终上下文向量,W2为线性层参数,b2为线性层参数。
4.一种完全并行化具有领域扩展性的端到端多轮对话方法,其特征在于,所述方法由权利要求1-3任一项所述的系统执行,其中,所述方法包括以下步骤:
在用户输入信息输入至输入嵌入层后,生成向量表示形式的输入信息;
对所述向量表示形式的输入信息进行编码,得到用户输入的抽象表示;
根据所述抽象表示得到对话状态表示;
根据所述对话状态表示查询得到查询结果;以及
在所述查询结果和对话状态共同输入至机器响应解码器后,生成机器回答。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910411706.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多轮人机对话方法、装置及设备
- 下一篇:问答对的生成方法和装置