[发明专利]用于答复问题的模型训练方法、装置、设备及存储介质在审
申请号: | 201811507887.8 | 申请日: | 2018-12-11 |
公开(公告)号: | CN109783617A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 林桂;黎旭东;谢国彤 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 黄章辉 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问题组 预设 最小距离 向量 存储介质 负面评价 模型训练 预设距离 答复 聚类 问题集合 用户咨询 检测 学习 更新 应用 | ||
1.一种用于答复问题的模型训练方法,其特征在于,包括:
每当在通过目标深度学习模型针对用户提出的问题反馈答案后,检测所述用户是否提交了关于答案的负面评价信息,所述目标深度学习模型由各个预设问题组作为训练数据预先训练得到;
若检测到所述用户提交了关于答案的负面评价信息,则获取所述负面评价信息所对应的评价问题;
当获取到的各个评价问题的数量达到预设第一数量阈值时,对所述各个评价问题进行无监督文本聚类,直到满足预设的条件,聚类后得到各个问题集,每个问题集包括一个以上的评价问题;
分别确定所述各个问题集的向量中心;
针对每个问题集,分别计算所述问题集的向量中心与各个所述预设问题组的向量中心的距离;
针对每个问题集,若计算得到的最小距离小于预设距离阈值,则将所述问题集合并至所述最小距离对应的预设问题组;
针对每个问题集,若计算得到的最小距离大于或等于预设距离阈值,则将所述问题集确定为新的预设问题组;
采用更新后的所述各个预设问题组重新对所述目标深度学习模型进行训练,得到训练后的目标深度学习模型。
2.根据权利要求1所述的用于答复问题的模型训练方法,其特征在于,所述目标深度学习模型通过以下步骤预先训练好:
获取所述各个预设问题组,每个预设问题组包括多个预先收集的问题语义相同的历史问题;
将获取到的各个所述历史问题两两配对,得到各个问题组合;
将两个配对的历史问题属于同一预设问题组的问题组合的标记值记为1,并将两个配对的历史问题不属于同一预设问题组的问题组合的标记值记为0;
对所述各个问题组合分别进行向量化处理,得到所述各个问题组合对应的组合向量;
将所有组合向量作为输入投入至所述目标深度学习模型,得到输出的各个样本概率值;
以输出的各个样本概率值作为调整目标,调整所述目标深度学习模型的参数,以最小化得到的所述各个样本概率值与各个问题组合对应的标记值之间的误差;
若所述各个样本概率值与各个问题组合对应的标记值之间的误差满足预设条件,则确定所述目标深度学习模型已训练好。
3.根据权利要求1所述的用于答复问题的模型训练方法,其特征在于,所述对所述各个评价问题进行无监督文本聚类,直到满足预设的条件,聚类后得到各个问题集包括:
将所述各个评价问题确定为各个初始的簇;
针对每个簇,分别计算所述簇与各个其它簇之间的距离;
针对每个簇,将距离所述簇最近的一个其它簇与所述簇合并,得到一个新的簇;
返回执行所述针对每个簇,分别计算所述簇与各个其它簇之间的距离的步骤,直到当前的各个簇满足预设的条件,将当前的各个簇确定为各个问题集。
4.根据权利要求1所述的用于答复问题的模型训练方法,其特征在于,在将所述问题集确定为新的预设问题组之前,还包括:
判断所述问题集中评价问题的数量是否小于或等于预设第三数量阈值;
若所述问题集中评价问题的数量大于预设第三数量阈值,则执行所述将所述问题集确定为新的预设问题组的步骤;
若所述问题集中评价问题的数量小于或等于预设第三数量阈值,则将所述问题集加入至预设的问题白名单中,所述问题白名单中记录的各个问题均预设有对应的答案,当所述目标深度学习模型针对用户提出的问题无法反馈答案时,将匹配问题对应的答案反馈给所述用户,所述匹配问题是指所述问题白名单中与所述用户提出的问题匹配的问题。
5.根据权利要求1至4中任一项所述的用于答复问题的模型训练方法,其特征在于,所述分别确定所述各个问题集的向量中心包括:
从所述各个问题集中分别随机选取一个评价问题;
对选取出的各个评价问题分别进行向量化处理,得到各个问题向量作为所述各个问题集的向量中心;
或
针对每个问题集,对所述问题集中每个评价问题分别进行向量化处理,得到所述问题集中各个评价问题对应的问题向量;
针对每个问题集,计算所述问题集中各个问题向量的平均值,得到向量均值作为所述问题集的向量中心。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811507887.8/1.html,转载请声明来源钻瓜专利网。