[发明专利]对话生成方法、装置、电子设备及存储介质有效
申请号: | 202110698815.1 | 申请日: | 2021-06-23 |
公开(公告)号: | CN113420542B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 林大权 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/30;G06F16/33;G06F16/332;G06F18/214 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 生成 方法 装置 电子设备 存储 介质 | ||
1.一种对话生成方法,其特征在于,所述方法包括:
获取原始对话数据,并将所述原始对话划分为提问内容和回复内容;
利用预构建的关键词提取模型,对所述回复内容执行关键词提取,得到所述回复内容的关键词,将所述回复内容的关键词记作所述回复内容的条件标签;
利用所述提问内容以及所述回复内容构建训练数据,并将所述条件标签向量化,得到条件向量标签;
利用所述条件向量标签对预构建的生成式预训练模型进行参数设置,并使用所述训练数据对所述生成式预训练模型进行模型训练,将利用所述训练数据中回复内容作为监督信号生成的训练结果与所述训练数据相比较;
根据比较结果判断所述训练结果是否满足预设的条件;
当所述训练结果不满足预设的条件时,返回利用所述条件向量标签对预构建的生成式预训练模型进行参数设置的步骤;
当所述训练结果满足预设的条件时,将得到所述训练结果的生成式预训练模型作为训练完成的生成式预训练模型;
接收用户的提问,利用所述训练完成的生成式预训练模型生成所述提问对应的回复。
2.如权利要求1所述的对话生成方法,其特征在于,所述利用所述提问内容以及所述回复内容构建训练数据,包括:
设置所述提问内容的提问标识符;
设置所述回复内容的回复标识符;
利用所述提问标识符、所述提问内容、所述回复标识符、及所述回复内容构建所述训练数据。
3.如权利要求1所述的对话生成方法,其特征在于,所述将所述条件标签向量化,得到条件向量标签,包括:
利用预设的嵌入网络将所述条件标签映射为条件向量;
利用预设的全连接网络将所述条件向量映射为与所述生成式语言模型相同的向量维度,得到所述条件向量标签。
4.如权利要求1所述的对话生成方法,其特征在于,所述利用所述条件向量标签对预构建的生成式预训练模型进行参数设置,包括:
构建包含归一化算法的生成式预训练模型;
根据所述条件向量标签对所述归一化算法进行参数更新。
5.如权利要求1所述的对话生成方法,其特征在于,所述根据比较结果判断所述训练结果是否满足预设的条件,包括:
判断所述训练结果和所述训练数据的相似度是否满足预设相似度阈值;
当所述训练结果和所述训练数据的相似度满足所述相似度阈值时,判断所述训练结果满足预设的条件;
当所述训练结果和所述训练数据的相似度不满足所述相似度阈值时,判断所述训练结果不满足预设的条件。
6.如权利要求1所述的对话生成方法,其特征在于,所述利用预构建的关键词提取模型,对所述回复内容执行关键词提取,得到所述回复内容的关键词之前,所述方法还包括:
接收训练完成的语言处理模型,修改所述语言处理模型的输出层,得到初始关键词提取模型;
接收训练文本集,对所述训练文本集执行分句操作,得到训练语段集;
接收用户在所述训练语段集中添加的关键词标签集;
利用所述训练语段集及所述关键词标签集,训练所述初始关键词提取模型,得到训练完成的关键词提取模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110698815.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于双重生成对抗网络的评分预测方法
- 下一篇:一种收线式充电桩