[发明专利]用于训练模型的方法和装置有效
申请号: | 202110693055.5 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113360346B | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 杨天行;杨晨;孙卓 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F16/33;G06F16/35;G06F40/30 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 训练 模型 方法 装置 | ||
1.一种用于训练用于确定设备故障信息的模型的方法,包括:
获取样本数据集,其中,所述样本数据集中包括样本文本、以及所述样本文本的标签,所述样本文本包括针对设备故障的初始描述信息,所述样本文本的标签包括针对所述设备故障的标准化描述信息,所述初始描述信息为非专业化的现象描述或者口语化的现象描述,所述标准化描述信息为专业化的现象描述;
根据所述样本文本的语义,获取增量样本文本,并根据所述样本文本的标签,确定所述增量样本文本的标签;
采用所述增量样本文本以及所述增量样本文本的标签,构建增量样本数据集;
采用所述样本数据集以及所述增量样本数据集,训练初始信息确定模型,并得到目标信息确定模型;
接收用户针对故障信息的反馈信息;
采用初始描述信息以及反馈信息,更新目标信息确定模型;
其中,所述根据所述样本文本的语义,获取增量样本文本,并根据所述样本文本的标签,确定所述增量样本文本的标签,包括:
采用自然语言识别方法、词语识别方法或者词语匹配方法确定出样本文本中的至少一个目标词语,并根据样本文本中的至少一个目标词语的语义或者词语所表征的文本主题,采用与目标词语的语义或者所表征的文本主题相同的词语替换该样本文本中的目标词语,以生成一条增量样本文本;
将所述样本文本的标签作为所生成的增量样本文本的标签,或者将与所述样本文本的标签相似的标签,作为该增量样本文本的标签;
对所述样本文本中的词语进行反义词替换,并将反义词替换后的样本文本确定为所述增量样本文本;
将与所述样本文本的标签所表征的类别相反的标签,确定为所述增量样本文本的标签;
其中,所述采用所述样本数据集以及所述增量样本数据集,训练初始信息确定模型,并得到目标信息确定模型,包括:
采用样本数据集中的样本文本作为初始信息确定模型的输入,将样本文本的标签作为初始信息确定模型的期望输出,训练初始信息确定模型;
将增量样本数据集中的增量样本文本作为初始信息确定模型的输入,将增量样本文本的标签作为初始信息确定模型的期望输出,训练初始信息确定模型,并得到训练完成的目标信息确定模型。
2.根据权利要求1所述的方法,其中,所述根据所述样本文本的语义,获取增量样本文本,并根据所述样本文本的标签,确定所述增量样本文本的标签,包括:
对所述样本文本中的词语进行同义词替换,并将同义词替换后的样本文本确定为所述增量样本文本;
将所述样本文本的标签确定为所述增量样本文本的标签。
3.根据权利要求1所述的方法,其中,所述样本文本的标签还包括:针对所述设备故障的解决方案。
4.一种用于确定设备故障信息的方法,包括:
获取针对设备故障的初始描述信息;
采用所述初始描述信息以及目标信息确定模型,确定所述设备的故障信息,其中,所述目标信息确定模型采用如权利要求1-3任一项所述的方法训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110693055.5/1.html,转载请声明来源钻瓜专利网。