[发明专利]应用于多轮对话系统的对话生成方法、装置、设备及介质在审
申请号: | 202210253749.1 | 申请日: | 2022-03-15 |
公开(公告)号: | CN114579728A | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 徐万珺 | 申请(专利权)人: | 四川新网银行股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/289;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 梁田 |
地址: | 610000 四川省成都市中国(四川)自由*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用于 轮对 系统 对话 生成 方法 装置 设备 介质 | ||
1.一种应用于多轮对话系统的对话生成方法,其特征在于,该方法包括:
获取用户的第一轮对话,利用语义理解模型对所述第一轮对话进行特征抽取,得到第一轮对话内容的语义特征表示;
根据所述语义特征表示,利用编码器对所述语义特征表示抽取深层次的语义信息,生成第一轮中间变量;
根据所述第一轮中间变量,利用意图特征计算网络对所述第一轮中间变量抽取得到意图特征表示;
将所述意图特征表示和所述第一轮中间变量分别解码,并将解码结果输入生成网络中,由所述生成网络完成响应,生成第一轮对话内容的响应文本并返回,至此完成是第一轮对话生成;
等待并获取下一轮对话,重复上述步骤,直至用户触发结束条件,本次多轮对话结束。
2.根据权利要求1所述的一种应用于多轮对话系统的对话生成方法,其特征在于,所述的等待并获取下一轮对话,重复上述步骤,直至用户触发结束条件,本次多轮对话结束;包括:
在执行第N轮对话时,将历史用户对话内容的意图特征表示组和所述第N-1轮中间变量分别解码,并将解码结果输入生成网络中,由所述生成网络完成响应,生成第N轮对话内容的响应文本并返回,至此完成是第N轮对话生成;
其中,所述历史用户对话内容的意图特征表示组为前N-1轮意图特征表示的集合,包括第一轮的意图特征表示、第二轮的意图特征表示、……、第N-1轮的意图特征表示。
3.根据权利要求1所述的一种应用于多轮对话系统的对话生成方法,其特征在于,所述的获取用户的第一轮对话,利用语义理解模型对所述第一轮对话进行特征抽取,得到第一轮对话内容的语义特征表示;具体包括:
根据用户的第一轮对话,获取用户的第一轮对话输入文本;
利用分词算法对用户的第一轮对话输入文本进行分词处理,得到分词序列S1=(s1,s2,...,st,...,sn);其中,st=onehot(xt),st为采用读热编码法将输入文本数据xt转换为的数值向量;t为分词序列中的第t个词;
将所述分词序列S1输入预设的语义理解模型中,对所述分词序列S1进行特征抽取,计算第一轮对话的语义向量W1=(w1,w2,...,wt,...wn)并输出,wt为第一轮对话的语义向量W1中的元素。
4.根据权利要求3所述的一种应用于多轮对话系统的对话生成方法,其特征在于,所述语义理解模型为bi-LSTM网络,采用所述bi-LSTM网络计算第一轮对话的语义向量,计算公式为:
式中,wt为第一轮对话的语义向量W1中的元素;是根据基于两个序列方向计算出的语义向量,MLP(·)是一层全连接网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川新网银行股份有限公司,未经四川新网银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210253749.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种聚烯烃用助剂组合物
- 下一篇:一种铸件变形热调整模具