[发明专利]一种结合动态词汇增强的模型蒸馏方法有效
申请号: | 202110309962.5 | 申请日: | 2021-03-24 |
公开(公告)号: | CN112699678B | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 顾嘉晟;李瀚清;岳小龙;高翔;纪达麒;陈运文 | 申请(专利权)人: | 达而观数据(成都)有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/242;G06N20/00 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 贾年龙 |
地址: | 610015 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及人工智能领域中的自然语言处理技术领域,公开了一种结合动态词汇增强的模型蒸馏方法,包括:在ALBert语言模型的基础上,通过微调技术结合动态词汇增强技术对语言模型进行调整,得到微调后的语言模型,将其作为教师模型;在对语言模型进行微调时,不同于常规的微调逻辑,在微调过程中,先将词典信息的特征与语言模型的输出特征进行合并,然后再进行微调;微调结束后,对教师模型进行蒸馏,将获取的模型预测结果作为学生模型的训练依据。本发明提供的模型蒸馏方法,通过引入词典信息作为关键信息,使得模型在大幅缩减尺寸的情况下仍然可以捕获词典信息作为特征,从而达到在不牺牲抽取准确性的情况下大幅降低模型尺寸、加快推断速度的目的。 | ||
搜索关键词: | 一种 结合 动态 词汇 增强 模型 蒸馏 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于达而观数据(成都)有限公司,未经达而观数据(成都)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110309962.5/,转载请声明来源钻瓜专利网。