[发明专利]客服机器人的模型训练方法、装置、电子设备及介质有效
申请号: | 202110548107.X | 申请日: | 2021-05-19 |
公开(公告)号: | CN113342946B | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 徐凯旋 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06K9/62;G06Q30/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 客服 机器人 模型 训练 方法 装置 电子设备 介质 | ||
1.一种客服机器人的模型训练方法,包括:
周期性采集网络资源文档;
在客服机器人的表格问答模型存在未识别的问题信息的情况下,将所述问题信息和各周期采集的网络资源文档输入文档问答模型,以从输入的网络资源文档中抽取得到所述问题信息对应的答复信息,所述文档问答模型采用所述网络资源文档训练得到;
根据所述问题信息及对应的答复信息对客服知识库进行更新,其中,基于所述客服机器人的表格问答模型未识别的问题信息及对应的答复信息,对所述客服知识库进行更新;
采用更新后的客服知识库对所述表格问答模型进行训练;
其中,所述采用更新后的客服知识库对所述表格问答模型进行训练,包括:
从所述更新后的客服知识库中提取得到问答对,作为训练样本;
采用所述训练样本对所述表格问答模型进行训练,使得所述表格问答模型学习得到所述问答对中所述问题信息和所述答复信息的对应关系。
2.根据权利要求1所述的模型训练方法,其中,所述将所述问题信息和各周期采集的网络资源文档输入文档问答模型,包括:
获取客服机器人的对话日志;
根据所述对话日志,查询得到所述表格问答模型未识别的多个问题信息;
确定多个问题信息之间的相似度;
根据所述多个问题信息之间的相似度,对所述多个问题信息进行筛选;
将筛选保留的问题信息和各周期采集的网络资源文档输入文档问答模型。
3.根据权利要求2所述的模型训练方法,其中,所述根据所述多个问题信息之间的相似度,对所述多个问题信息进行筛选,包括:
根据所述多个问题信息之间的相似度对所述多个问题信息进行聚类,生成多个问题类别;
根据所述多个问题类别中包含的问题信息的个数,对所述多个问题类别进行排序;
保留排序在前的设定个数的问题类别中所包含的问题信息。
4.根据权利要求1所述的模型训练方法,其中,所述从输入的网络资源文档中抽取得到所述问题信息对应的答复信息,包括:
对所述问题信息进行语义识别,得到语义识别结果;
将所述语义识别结果与所述网络资源文档进行匹配,确定与所述语义识别结果匹配的文档内容;
抽取所述文档内容之前预设个数的字符和所述文档内容之后预设个数的字符,得到所述问题信息对应的答复信息。
5.根据权利要求2所述的模型训练方法,其中,所述获取客服机器人的对话日志之后,还包括:
根据预设的过滤规则,对所述对话日志中的文本进行过滤。
6.根据权利要求2所述的模型训练方法,其中,所述获取客服机器人的对话日志之后,还包括:
确定所述对话日志中的文本与第一知识库中预存文本之间的文本相似度;其中,所述第一知识库包括非专业的对话文本;
从所述对话日志中删除所述文本相似度大于相似度阈值的文本。
7.一种客服机器人的模型训练装置,包括:
采集模块,用于周期性采集网络资源文档;
输入模块,用于在客服机器人的表格问答模型存在未识别的问题信息的情况下,将所述问题信息和各周期采集的网络资源文档输入文档问答模型,以从输入的网络资源文档中抽取得到所述问题信息对应的答复信息,所述文档问答模型采用所述网络资源文档训练得到;
更新模块,用于根据所述问题信息及对应的答复信息对客服知识库进行更新,其中,基于所述客服机器人的表格问答模型未识别的问题信息及对应的答复信息,对所述客服知识库进行更新;
训练模块,用于采用更新后的客服知识库对所述表格问答模型进行训练;
其中,所述训练模块,还用于:
从所述更新后的客服知识库中提取得到问答对,作为训练样本;
采用所述训练样本对所述表格问答模型进行训练,使得所述表格问答模型学习得到所述问答对中所述问题信息和所述答复信息的对应关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110548107.X/1.html,转载请声明来源钻瓜专利网。