[发明专利]一种语义理解模型训练方法、语义理解方法、装置及存储介质在审
申请号: | 201911047125.9 | 申请日: | 2019-10-30 |
公开(公告)号: | CN110795945A | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 袁刚;赵学敏 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/35;G06N20/00 |
代理公司: | 11270 北京派特恩知识产权代理有限公司 | 代理人: | 赵翠萍;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种语义理解模型训练方法,包括:对数据源中的与车载环境相匹配的训练样本进行召回处理;对与车载环境相匹配的带有噪声的语句样本进行边界语料扩充处理;对经过边界语料扩充处理的与车载环境相匹配的带有噪声的语句样本进行标注,以形成第一训练样本集合;通过语义理解模型对第二训练样本集合进行处理;根据语义理解模型的更新参数,通过第二训练样本集合对语义理解模型的语义表示层网络参数和任务相关输出层网络参数进行迭代更新。本发明还提供了语义理解方法、装置及存储介质。本发明能够提升语义理解模型的训练精度与训练速度,使得语义理解模型能够适应车载环境全双工使用场景,避免环境噪声对语义理解模型的影响。 | ||
搜索关键词: | 语义理解 车载环境 训练样本集合 匹配 网络参数 语句 语料 噪声 样本 存储介质 迭代更新 更新参数 环境噪声 模型训练 使用场景 训练样本 语义表示 全双工 输出层 数据源 标注 | ||
【主权项】:
1.一种语义理解模型训练方法,其特征在于,所述方法包括:/n对数据源中的与车载环境相匹配的训练样本进行召回处理;/n根据所述召回处理的结果,触发相应的主动学习进程,以实现获取所述数据源中与车载环境相匹配的带有噪声的语句样本;/n响应于所述主动学习进程,触发主动探索进程,以实现对所述与车载环境相匹配的带有噪声的语句样本进行边界语料扩充处理;/n对经过边界语料扩充处理的与车载环境相匹配的带有噪声的语句样本进行标注,以形成第一训练样本集合;/n对所述第一训练样本集合进行去噪处理,以形成相应的第二训练样本集合;/n通过语义理解模型对所述第二训练样本集合进行处理,以确定所述语义理解模型的初始参数;/n响应于所述语义理解模型的初始参数,通过所述语义理解模型对所述第二训练样本集合进行处理,确定所述语义理解模型的更新参数;/n根据所述语义理解模型的更新参数,通过所述第二训练样本集合对所述语义理解模型的语义表示层网络参数和任务相关输出层网络参数进行迭代更新。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911047125.9/,转载请声明来源钻瓜专利网。