[发明专利]人机对话中智能体对话语句的生成方法和装置有效
申请号: | 202110133448.0 | 申请日: | 2021-02-01 |
公开(公告)号: | CN112860862B | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 宇洋;袁彩霞;王小捷;刘咏彬;李蕾 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 孙清然;王琦 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人机对话 智能 对话 语句 生成 方法 装置 | ||
1.一种人机对话中智能体对话语句的生成方法,其特征在于,包括:
利用预先训练的自然语言理解模型,从当前人机对话的对话历史数据中,提取预设知识库中的属性值和场景类别;其中,所述知识库由知识三元组构成;
基于所述属性值和所述场景类别,从所述知识库中筛选出相关的知识三元组,得到候选知识子集;
基于所述对话历史数据和所述候选知识子集,利用预先训练的对话生成模型,为智能体生成当前的响应语句并输出;
其中,所述提取预设知识库中的属性值和场景类别包括:
将所述对话历史数据与预设特殊标记拼接后,输入至所述自然语言理解模型的编码器进行编码,得到相应的对话历史向量和场景信息向量;
将所述对话历史向量,输入至所述自然语言理解模型的CRF层进行序列标注,得到所述对话历史数据包含的所述属性值;
将所述场景信息向量,输入至所述自然语言理解模型的多层感知机进行场景分类,得到所述人机对话的场景类别。
2.根据权利要求1所述的方法,其特征在于,所述基于所述属性值和所述场景类别,从所述知识库中筛选出相关的知识三元组,得到候选知识子集包括:
如果所述场景类别为闲聊,则遍历每个所述属性值,从所述知识库中查找包含该属性值的知识三元组,利用查找出的所有知识三元组,构建所述候选知识子集;
如果所述场景类别为问答,则遍历所述对话历史数据中最新一轮对话包含的每个属性值,从所述知识库中查找包含该属性值的知识三元组;利用查找出的所有知识三元组,构建所述候选知识子集;
如果所述场景类别为推荐,则将所述属性值中的所有主键实体值进行两两组合,遍历每种所述组合,确定该组合中的属性值具有的共同属性值,对于每个所述共同属性值,从所述知识库中查找包含该共同属性值的知识三元组;利用查找出的所有知识三元组,构建所述候选知识子集;
如果所述场景类别为任务型对话,则遍历所述属性值中的每个主键实体值,从所述知识库中查找包含该主键实体值且与当前人机对话任务相关的知识三元组,利用查找出的所有知识三元组,构建所述候选知识子集。
3.根据权利要求1所述的方法,其特征在于,所述基于所述对话历史数据和所述候选知识子集,利用预先训练的对话生成模型,为智能体生成当前的响应语句包括:
将所述对话历史数据,输入至所述对话生成模型的对话编码器进行编码处理,得到所述对话历史数据的综合表征向量C和所述对话历史数据包含的所有词的词向量;
将所述候选知识子集,输入至所述对话生成模型的知识编码器进行编码,得到所述候选知识子集的综合表征向量kg和所述候选知识子集中每条知识三元组的向量表示;
基于所述对话历史数据的综合表征向量C、所述候选知识子集的综合表征向量kg、所述词向量和所述知识三元组的向量表示,利用所述对话生成模型的自然语言生成器,生成所述响应语句。
4.根据权利要求3所述的方法,其特征在于,所述将所述对话历史数据,输入至所述对话生成模型的对话编码器进行编码处理包括:
通过在所述对话历史数据中增加每个词所属的对话角色信息和对话轮次信息,对所述对话历史数据进行扩充;
按照对话轮次,对所述扩充后的对话历史数据进行划分;
利用句子级双向门限循环神经网络BiGRU,对所述划分得到的每轮对话数据进行编码,得到每轮对话包含的所有词的词向量;
基于每轮对话包含的所有词的词向量,采用自注意力机制计算每轮对话的第一对话向量;
利用对话轮次级BiGRU,对所有轮对话的所述第一对话向量进行编码,得到每轮对话的第二对话向量;
基于所述第二对话向量,采用自注意力机制计算所述对话历史数据的综合表征向量C。
5.根据权利要求3所述的方法,其特征在于,所述将所述候选知识子集,输入至所述对话生成模型的知识编码器进行编码包括:
利用TransE模型,计算所述候选知识子集中每条知识三元组的实体词向量;
基于每条知识三元组的所述实体词向量,利用多层感知机,得到所述候选知识子集中每条知识三元组的向量表示;
基于每条知识三元组的所述向量表示,利用自注意力机制,得到所述候选知识子集的综合表征向量kg。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110133448.0/1.html,转载请声明来源钻瓜专利网。