[发明专利]面向自然语言模型的联邦小样本学习方法、系统及设备在审
申请号: | 202310208694.7 | 申请日: | 2023-03-07 |
公开(公告)号: | CN116127018A | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 徐梦炜;蔡栋琪;周傲;马骁;王尚广 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F18/214;G06F18/241 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 牛峥;王丽琴 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 自然语言 模型 联邦 样本 学习方法 系统 设备 | ||
本申请实施例公开了一种面向自然语言模型的联邦小样本学习方法、系统及设备,在对自然语言模型进行微调时,由云端服务器控制多个端侧设备,采用渐进式数据增强协同方式进行,即采用基于伪标签方式及提示学习方式进行融合的联邦小样本学习方式与联邦学习方式协同进行,且在微调过程中不断更新最优的增强策略,从而使得各个端侧设备采用的训练数据包含少量的有标签的样本就可以微调得到精确率高的自然语言模型。因此,本申请实施例可以采用少量的有标签的训练数据微调一个精确率高的自然语言模型,提高微调后的自然语言模型的精确率。
技术领域
本申请涉及人工神经网络技术领域,特别涉及一种面向自然语言模型的联邦小样本学习方法、系统及设备。
背景技术
随着自然语言处理技术地不断发展和端侧设备计算性能地不断提升,大量的涉及自然语言处理技术应用被部署到端侧设备上,比如:输入法智能补全应用、智能问答系统应用及个人语言助理应用等都可以被部署到端侧设备上。
为了实现自然语言处理技术应用,就需要对自然语言模型进行训练。通常,自然语言模型的训练分为模型预训练阶段和模型微调阶段。其中,在模型预训练阶段,云端服务器使用大量的中心化公开的训练数据训练一个通用的预训练自然语言模型;在模型微调阶段,根据不同任务场景,对该预训练自然语言模型进行微调,以提升模型在特定任务上的精确率。
训练自然语言模型的核心问题是训练数据如何获取。虽然模型预训练阶段的训练数据可以采用大量公开的无标签数据集,但是模型微调阶段使用的训练数据往往是私密的及有标签的样本,且分布在大量端侧设备上,在进行微调时可以将这些样本集中到一个中心数据库中进行集中微调,但是无疑会带来隐私泄露的问题。此外在模型微调阶段采用的训练数据需要有标签,而直接采用已有样本通常缺少正确的标签甚至没有标签,即使少数已有样本拥有标签,由于已有样本的异构性,聚焦于这些样本会损伤微调模型的鲁棒性,降低训练得到的模型的精确率。
因此,如何采用少量的有标签的训练数据微调一个精确率高的自然语言模型成为一个亟待解决的问题。
发明内容
有鉴于此,本申请实施例提供一种面向自然语言模型的联邦小样本学习方法,该方法能够采用少量的有标签的训练数据微调一个精确率高的自然语言模型,提高微调后的自然语言模型的精确率。
本申请实施例还提供一种面向自然语言模型的联邦小样本学习系统及设备,该系统及设备能够采用少量的有标签的训练数据微调一个精确率高的自然语言模型,提高微调后的自然语言模型的精确率。
本申请的一个实施例中,提供一种面向自然语言模型的联邦小样本学习方法,所述方法包括:
a、云端服务器选择一增强策略;
b、云端服务器基于所述增强策略,将自然语言模型发送给两个端侧设备集群,以使所述两个端侧设备集群分别采用联邦学习方式及采用预设的联邦小样本学习方式,对所述自然语言模型进行当前迭代轮的协同微调,得到下一迭代轮的所述自然语言模型;
c、云端服务器基于所述增强策略,将所述下一迭代轮的所述自然语言模型作为当前迭代轮的所述自然语言模型,发送给所述两个端侧设备集群,以使所述两个端侧设备集群分别采用联邦学习方式及采用预设的联邦小样本学习方式,对所述当前迭代轮的所述自然语言模型进行协同微调,得到下一迭代轮的所述自然语言模型;
d、云端服务器确定经过所述协同微调的迭代轮数量是否小于设定的迭代轮阈值,如果是,返回步骤c执行,如果否,执行步骤e;
e、云端服务器计算所述下一迭代轮的所述自然语言模型的目标结果精确率是否小于预设的精确率阈值,如果是,将所述下一迭代轮的所述自然语言模型作为微调后的所述自然语言模型,如果否,返回步骤a继续执行。
在上述方法中的所述步骤a之前,还包括得到至少一增强策略的过程:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310208694.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无接触式智能医疗垃圾桶
- 下一篇:一种PCB盲槽产品及其制作方法