[发明专利]一种基于知识驱动的多路筛选融合对话生成方法在审

专利信息
申请号: 202210429373.5 申请日: 2022-04-22
公开(公告)号: CN115422329A 公开(公告)日: 2022-12-02
发明(设计)人: 马廷淮;张峥 申请(专利权)人: 南京信息工程大学
主分类号: G06F16/332 分类号: G06F16/332;G06N3/04;G06N3/08
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 陈月菊
地址: 210044 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 知识 驱动 筛选 融合 对话 生成 方法
【权利要求书】:

1.一种基于知识驱动的多路筛选融合对话生成方法,其特征在于,所述生成方法包括以下步骤:

S10,对当前对话的上下文进行包括分词、词嵌入在内的预处理,将预处理结果送入由双向GRU组成的话语编码器中对上下文信息进行编码,获取相应的语义向量{hi};i=1,2,…,n;

S20,基于多路知识筛选机制,通过计算步骤S10得到的语义向量信息与知识集合{ki}中每条知识的相似度,从知识集合中选择与当前对话最相关的知识信息ka和kb,融合得到筛选后的知识信息k′i

S30,基于双向GRU神经网络构建知识融合模块,采用知识融合模块将步骤S20得到的知识信息k′i与步骤S10中获取的上下文的语义信息{hi}融合,借助注意力机制计算得到中间语义向量ct

S40,将步骤S30得到的中间语义向量ct和步骤S20中得到的知识信息k′i一同送入解码器中进行响应的生成。

2.根据权利要求1所述的基于知识驱动的多路筛选融合对话生成方法,其特征在于,步骤S10中,获取相应的语义向量{hi}的过程包括以下步骤:

S11,利用NLTK工具将包含上下文信息的相关数据进行分词后,借助Glove转换成固定维度的词向量;

S12,基于双向GRU单元构成源句子编码器,将步骤S11的转换结果输送到源句子编码器中,将对话上下文编码成固定维度向量,编码的每一步输出该时间步的隐藏状态,最后一时刻时间步用以表示该上下文的语义信息,将输入上下文编码成一固定长度的语义向量,得到上下文的隐层状态h={h1,h2,…,hn}。

3.根据权利要求1所述的基于知识驱动的多路筛选融合对话生成方法,其特征在于,步骤S20中,从知识集合中选择与当前对话最相关的知识信息ka和kb的过程包括以下步骤:

S21,利用余弦相似度,获取上下文信息对应的语义向量与知识集合中每条知识的相似度得分,获取得分最高的知识信息记为ka

S22,根据后验知识信息获取后验知识分布,利用后验知识分布与先验知识分布进行知识的筛选;采用KL散度拉近先验知识分布与后验分布之间的距离,使先验分布不断逼近后验分布,借助先验分布获取相关的知识,将该知识记为kb;其中,根据如下公式获取先验知识分布和后验知识分布:

其中,ki为知识集合中的每条知识,x为输入的上下文信息,y为数据集中真实响应信息,kj代表知识集合中的全部知识,j为知识的序列号,N代表知识集合中知识的条数。

4.根据权利要求1所述的基于知识驱动的多路筛选融合对话生成方法,其特征在于,步骤S30中,计算得到中间语义向量ct的过程包括以下步骤:

S31,根据每条知识信息的相关系数,加权求和获取最终的知识信息表达形式;

S32,采用双向GRU神经网络对步骤S31获取的知识信息和步骤S10获取的上下文的语义信息{hi}共同进行编码,将筛选后的知识表示k′i作为双向GRU神经网络的初始状态,同时将每一时刻的隐藏状态hi作为双向GRU神经网络的每一步输入,得到双向GRU的最终状态作为中间语义向量ct

5.根据权利要求1所述的基于知识驱动的多路筛选融合对话生成方法,其特征在于,步骤S40中,将步骤S30得到的中间语义向量ct和步骤S20中得到的知识信息k′i一同送入解码器中进行响应的生成的过程包括以下步骤:

基于知识语义表达k′i和中间语义向量ct,将每一时间步的解码状态通过全连接网络映射到词表大小的维度,并通过softmax函数计算出候选回复词的概率分布,选择概率最大的词作为当前时间步的回复yt,将所有时间步的预测回复联合起来得到最终的预测回复序列Y。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210429373.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top