[发明专利]意图识别模型的训练方法、系统、装置及可读存储介质在审
申请号: | 201810015726.0 | 申请日: | 2018-01-08 |
公开(公告)号: | CN108090520A | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 韩卫强;权圣 | 申请(专利权)人: | 北京中关村科金技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 100025 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种意图识别模型的训练方法、系统、装置及可读存储介质,包括预先根据源任务模型和源任务标注语料训练基础模型;将基础模型的网络层的参数导入到目标任务模型的公共网络层中,并固定公共网络层的参数;通过目标任务标注语料微调目标任务模型的特有网络层的参数,其中,特有网络层为目标任务模型中除公共网络层外的网络层,源任务标注语料的数量大于目标任务标注语料的数量。本发明通过对源任务语料及源任务模型迁移学习来训练目标任务模型,只需要标注少量的目标任务语料对目标任务模型进行微调就可以使目标任务模型获得较高的准确率,节约了目标任务模型的训练成本,同时还能有效的减少目标任务模型的训练时间。 | ||
搜索关键词: | 任务模型 语料 标注 网络层 公共网络层 可读存储介质 基础模型 意图识别 微调 训练目标 准确率 迁移 节约 学习 | ||
【主权项】:
1.一种意图识别模型的训练方法,其特征在于,包括:预先根据源任务模型和源任务标注语料训练基础模型;将所述基础模型的网络层的参数导入到目标任务模型的公共网络层中,并固定所述公共网络层的参数;通过目标任务标注语料微调所述目标任务模型的特有网络层的参数,其中,所述特有网络层为所述目标任务模型中除所述公共网络层外的网络层,所述源任务标注语料的数量大于所述目标任务标注语料的数量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中关村科金技术有限公司,未经北京中关村科金技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810015726.0/,转载请声明来源钻瓜专利网。