[发明专利]一种基于知识追踪与转移的人机对话方法有效

申请号：	202010253520.9	申请日：	2020-04-02
公开（公告）号：	CN113495943B	公开（公告）日：	2023-07-14
发明（设计）人：	陈竹敏;孟川;任鹏杰;孙维纬;任昭春	申请（专利权）人：	山东大学
主分类号：	G06F16/33	分类号：	G06F16/33;G06F16/332;G06N3/04;G06N3/084;G06N3/088
代理公司：	青岛华慧泽专利代理事务所(普通合伙) 37247	代理人：	刘娜
地址：	250013 山***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于知识追踪转移人机对话方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于知识追踪与转移的人机对话方法，其特征在于，该方法包括如下步骤：

步骤一，构建具备知识追踪与转移功能的模型；

所述模型采用基于深度学习的编码-解码框架，包含编码层、知识追踪转移层和解码层；

步骤二，根据所构建的模型，使用先验-后验对偶学习机制训练模型参数；

步骤三，训练完成后，模型参数全部固定，然后进行实际对话应用；

所述编码层包含一个BERT编码器，分别把知识库和对话上下文编码成隐状态表示；

所述知识追踪转移层包含一个先验知识追踪器pri、一个知识转移器shi和一个后验知识追踪器pos，先验知识追踪器pri把对话上下文的隐状态表示作为输入，预测一个在知识库中所有文本片段上的先验知识追踪分布，从该分布中可采样一个追踪到的知识及其隐状态表示；知识转移器shi把追踪到的知识与对话上下文的隐状态表示共同作为输入，预测一个在知识库中所有文本片段上的知识转移分布，从该分布中可采样一个转移到的知识及其隐状态表示；后验知识追踪器pos额外地把转移到的知识的隐状态表示作为输入，预测一个在知识库中所有文本片段上的后验知识追踪分布，从该分布中可采样一个追踪到的知识及其隐状态表示；

所述解码层包含一个Transformer解码器，其将转移到的知识与对话上下文的隐状态表示共同作为输入，逐词生成最终回复；

步骤二的训练过程中，使后验知识追踪器pos和知识转移器shi互为对偶任务，使二者以无监督的方式互相指导提升，多轮迭代直至收敛，并且使先验知识追踪器pri同时从二者的对偶交互中获益；具体训练过程如下:

Step1：热身训练，使用极大似然估计最大化训练集中标注数据的概率，训练至参数收敛后，热身训练结束；

Step2：单轮迭代开始，首先通过后验知识追踪器pos去指导提升知识转移器shi；

Step3：通过知识转移器shi指导提升后验知识追踪器pos；

Step4：将KL散度损失与MLE损失线性加和进行联合训练，令先验知识追踪分布模拟并逼近后验知识追踪分布；至此，单轮迭代结束；

Step5：重复执行Step2-Step4，形成多轮迭代，直至模型参数进一步收敛。

2.根据权利要求1所述的一种基于知识追踪与转移的人机对话方法，其特征在于，后验知识追踪器pos与知识转移器shi之间形成一个对偶闭环，且后验知识追踪器pos仅在模型训练时执行，在模型应用时不执行。

3.根据权利要求1所述的一种基于知识追踪与转移的人机对话方法，其特征在于，步骤三在实际对话应用中，给定知识库和包含用户输入的对话上下文，先执行BERT编码器获取二者的隐状态表示，而后按顺序执行先验知识追踪器pri和知识转移器shi，完成知识追踪与转移，最后将知识转移器shi推出的转移到的知识喂给Transformer解码器生成最终回复。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于山东大学，未经山东大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010253520.9/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于知识追踪与转移的人机对话方法有效

专利文献下载