[发明专利]端到端检索式对话方法与系统及计算机设备有效
申请号: | 202010145309.5 | 申请日: | 2020-03-05 |
公开(公告)号: | CN110990555B | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 潘伟;金聪;廖健;祝大裕 | 申请(专利权)人: | 中邮消费金融有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N3/04;G06N3/08 |
代理公司: | 广州微斗专利代理有限公司 44390 | 代理人: | 唐立平 |
地址: | 511458 广东省广州市南沙区海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 端到端 检索 对话 方法 系统 计算机 设备 | ||
1.一种端到端检索式对话方法,其特征在于,包括如下步骤:
S1:将当前对话流程的上下文信息进行连接得到查询长文本;
S2:对查询长文本和候选系统回复进行编码,获得查询长文本词向量和候选系统回复词向量;
S3:将查询长文本词向量和候选系统回复词向量通过双向LSTM层,得到双向查询长文本词向量和双向候选系统回复词向量;
S4:使双向查询长文本词向量和双向候选系统回复词向量通过注意力机制,得到查询长文本对偶编码词向量和候选系统回复对偶编码词向量,并将查询长文本对偶编码词向量和候选系统回复对偶编码词向量分别与对应的查询长文本词向量和候选系统回复词向量进行拼接,得到查询长文本拼接词向量和候选系统回复拼接词向量;
S5:将查询长文本拼接词向量和候选系统回复拼接词向量通过双向LSTM层,得到双向查询长文本拼接词向量和双向候选系统回复拼接词向量;
S6:将双向查询长文本拼接词向量和双向候选系统回复拼接词向量进行张量点积,得到词相似度矩阵;
S7:将词相似度矩阵进行卷积操作,输出短语级别语义特征图;
S8:在短语级别语义特征图上进行卷积操作,输出句子级别语义特征图;
S9:将句子级别语义特征图输入全连接层,得到文本相似度评分;
S10:选择相似度评分最高的候选系统回复作为最终的系统回复。
2.根据权利要求1所述的端到端检索式对话方法,其特征在于,在步骤S1中,将当前对话流程的上下文信息依次首尾相接,得到查询长文本,在步骤S2中,采用Bert预训练模型的编码模块对查询长文本和候选系统回复进行编码。
3.根据权利要求1所述的端到端检索式对话方法,其特征在于,在步骤S4中,在使双向查询长文本词向量和双向候选系统回复词向量通过注意力机制得到查询长文本对偶编码词向量和候选系统回复对偶编码词向量时,记表示当前双向查询长文本词向量,表示当前双向候选系统回复词向量,计算注意力权重及对偶编码词向量的公式如下:
其中,(2)式和(3)式分别对应双向查询长文本词向量对所有的双向候选系统回复词向量做注意力和双向候选系统回复词向量对所有的双向查询长文本词向量做注意力,和分别表示查询长文本对偶编码词向量和候选系统回复对偶编码词向量。
4.根据权利要求1所述的端到端检索式对话方法,其特征在于,在步骤S3和步骤S5中,分别在双向LSTM层上进一步进行Layer Normalization操作,在步骤S7和步骤S8中,进行卷积操作后进一步进行Batch Normalization操作,在步骤S9中,在全连接层,使用sigmoid函数作为激活函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中邮消费金融有限公司,未经中邮消费金融有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010145309.5/1.html,转载请声明来源钻瓜专利网。