[发明专利]对话生成方法、装置、电子设备及存储介质有效
申请号: | 202110698815.1 | 申请日: | 2021-06-23 |
公开(公告)号: | CN113420542B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 林大权 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/30;G06F16/33;G06F16/332;G06F18/214 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 生成 方法 装置 电子设备 存储 介质 | ||
本发明涉及语音语义技术,揭露一种对话生成方法,包括:将获取的原始对话划分为提问内容和回复内容;提取回复内容的关键词,根据关键词设置条件标签;利用提问内容以及回复内容构建训练数据,将条件标签向量化后对预构建的生成式预训练模型进行参数设置,并使用训练数据对生成式预训练模型进行模型训练,将利用所述训练数据中回复内容作为监督信号生成的训练结果与所述训练数据相比较,得到训练完成的生成式预训练模型;接收用户的提问,利用训练完成的生成式预训练模型生成所述提问对应的回复。本发明还提出一种对话生成装置、设备及存储介质。本发明还涉及区块链技术,所述训练数据可存储于区块链节点中。本发明可以提高对话生成的准确性。
技术领域
本发明涉及语音语义领域,尤其涉及一种对话生成方法、装置、电子设备及计算机可读存储介质。
背景技术
基于生成式语言模型的对话生成技术可以根据历史对话获取用户的潜在意图并生成相应回复,根据此对话生成技术构建的任务导向型对话系统能够分析对话内容完成具体的任务,例如根据和用户的对话为用户寻找需求的商品,为用户预定酒店等。
但现有的生成式语言模型由于对话生成技术的规则设定过于复杂,需要大量的人力成本,并且无法穷举用户的所有需求,并且由于对话生成技术的规则在提高生成式语言模型的泛用性的同时无法保证回复明确性的问题,容易产生较为无关紧要的,不明确的回复。
发明内容
本发明提供一种对话生成方法、装置、电子设备及计算机可读存储介质,其主要目的在于精准性的实现对话生成。
为实现上述目的,本发明提供的一种对话生成方法,包括:
获取原始对话数据,并将所述原始对话划分为提问内容和回复内容;
提取所述回复内容的关键词,并根据所述关键词设置所述回复内容的条件标签;
利用所述提问内容以及所述回复内容构建训练数据,并将所述条件标签向量化,得到条件向量标签;
利用所述条件向量标签对预构建的生成式预训练模型进行参数设置,并使用所述训练数据对所述生成式预训练模型进行模型训练,将利用所述训练数据中回复内容作为监督信号生成的训练结果与所述训练数据相比较;
根据比较结果判断所述训练结果是否满足预设的条件;
当所述训练结果不满足预设的条件时,返回利用所述条件向量标签对预构建的生成式预训练模型进行参数设置的步骤;
当所述训练结果满足预设的条件时,将得到所述训练结果的生成式预训练模型作为训练完成的生成式预训练模型;
接收用户的提问,利用所述训练完成的生成式预训练模型生成所述提问对应的回复。
可选地,所述利用所述提问内容以及所述回复内容构建训练数据,包括:
设置所述提问内容的提问标识符;
设置所述回复内容的回复标识符;
利用所述提问标识符、所述提问内容、所述回复标识符、及所述回复内容构建所述训练数据。
可选地,所述将所述条件标签向量化,得到条件向量标签,包括:
利用预设的嵌入网络将所述条件标签映射为条件向量;
利用预设的全连接网络将所述条件向量映射为与所述生成式语言模型相同的向量维度,得到所述条件向量标签。
可选的,所述利用所述条件向量标签对预构建的生成式预训练模型进行参数设置,包括:
构建包含归一化算法的生成式预训练模型;
根据所述条件向量标签对所述归一化算法进行参数更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110698815.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于双重生成对抗网络的评分预测方法
- 下一篇:一种收线式充电桩