[发明专利]一种基于知识追踪与转移的人机对话方法有效

专利信息
申请号: 202010253520.9 申请日: 2020-04-02
公开(公告)号: CN113495943B 公开(公告)日: 2023-07-14
发明(设计)人: 陈竹敏;孟川;任鹏杰;孙维纬;任昭春 申请(专利权)人: 山东大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/332;G06N3/04;G06N3/084;G06N3/088
代理公司: 青岛华慧泽专利代理事务所(普通合伙) 37247 代理人: 刘娜
地址: 250013 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 知识 追踪 转移 人机对话 方法
【权利要求书】:

1.一种基于知识追踪与转移的人机对话方法,其特征在于,该方法包括如下步骤:

步骤一,构建具备知识追踪与转移功能的模型;

所述模型采用基于深度学习的编码-解码框架,包含编码层、知识追踪转移层和解码层;

步骤二,根据所构建的模型,使用先验-后验对偶学习机制训练模型参数;

步骤三,训练完成后,模型参数全部固定,然后进行实际对话应用;

所述编码层包含一个BERT编码器,分别把知识库和对话上下文编码成隐状态表示;

所述知识追踪转移层包含一个先验知识追踪器pri、一个知识转移器shi和一个后验知识追踪器pos,先验知识追踪器pri把对话上下文的隐状态表示作为输入,预测一个在知识库中所有文本片段上的先验知识追踪分布,从该分布中可采样一个追踪到的知识及其隐状态表示;知识转移器shi把追踪到的知识与对话上下文的隐状态表示共同作为输入,预测一个在知识库中所有文本片段上的知识转移分布,从该分布中可采样一个转移到的知识及其隐状态表示;后验知识追踪器pos额外地把转移到的知识的隐状态表示作为输入,预测一个在知识库中所有文本片段上的后验知识追踪分布,从该分布中可采样一个追踪到的知识及其隐状态表示;

所述解码层包含一个Transformer解码器,其将转移到的知识与对话上下文的隐状态表示共同作为输入,逐词生成最终回复;

步骤二的训练过程中,使后验知识追踪器pos和知识转移器shi互为对偶任务,使二者以无监督的方式互相指导提升,多轮迭代直至收敛,并且使先验知识追踪器pri同时从二者的对偶交互中获益;具体训练过程如下:

Step1:热身训练,使用极大似然估计最大化训练集中标注数据的概率,训练至参数收敛后,热身训练结束;

Step2:单轮迭代开始,首先通过后验知识追踪器pos去指导提升知识转移器shi;

Step3:通过知识转移器shi指导提升后验知识追踪器pos;

Step4:将KL散度损失与MLE损失线性加和进行联合训练,令先验知识追踪分布模拟并逼近后验知识追踪分布;至此,单轮迭代结束;

Step5:重复执行Step2-Step4,形成多轮迭代,直至模型参数进一步收敛。

2.根据权利要求1所述的一种基于知识追踪与转移的人机对话方法,其特征在于,后验知识追踪器pos与知识转移器shi之间形成一个对偶闭环,且后验知识追踪器pos仅在模型训练时执行,在模型应用时不执行。

3.根据权利要求1所述的一种基于知识追踪与转移的人机对话方法,其特征在于,步骤三在实际对话应用中,给定知识库和包含用户输入的对话上下文,先执行BERT编码器获取二者的隐状态表示,而后按顺序执行先验知识追踪器pri和知识转移器shi,完成知识追踪与转移,最后将知识转移器shi推出的转移到的知识喂给Transformer解码器生成最终回复。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010253520.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top