[发明专利]模型训练方法和语言模型训练方法及装置在审
申请号: | 202310389228.3 | 申请日: | 2023-04-12 |
公开(公告)号: | CN116401551A | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 郭明坤 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/24;G06N3/08;G06V10/774;G06V10/764;G06V10/82 |
代理公司: | 北京市通商律师事务所 11951 | 代理人: | 许念如 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 语言 装置 | ||
1.一种模型训练方法,所述方法包括:
获取至少一种目标类别;
确定每种所述目标类别对应的文本提示词,所述文本提示词用于描述所述目标类别的属性;
分别将每种所述目标类别对应的文本提示词输入数据生成模型,通过所述数据生成模型输出每种所述目标类别对应的样本数据;
采用所述至少一种目标类别分别对应的所述样本数据,对AI网络进行训练,得到目标AI模型,所述目标AI模型具有根据输入的目标数据预测所述目标数据所属的目标类别的功能。
2.根据权利要求1所述的方法,所述确定每种所述目标类别对应的文本提示词,包括:
分别将每种所述目标类别的名称字段输入语言模型,通过所述语言模型输出每种所述目标类别对应的文本提示词;
其中,所述语言模型是采用样本名称字段作为输入、所述样本名称字段对应的标注文本提示词作为输出,对神经网络进行训练得到的。
3.根据权利要求1或2所述的方法,所述采用所述至少一种目标类别分别对应的所述样本数据,对AI网络进行训练,得到目标AI模型,包括:
对每种所述目标类别对应的所述样本数据进行筛选,得到每种所述目标类别对应的符合质量规则的目标样本数据;
采用所述至少一种目标类别分别对应的所述目标样本数据,对AI网络进行训练,得到所述目标AI模型。
4.根据权利要求1-3任一项所述的方法,所述采用所述至少一种目标类别分别对应的所述样本数据,对AI网络进行训练,得到目标AI模型之后,所述方法还包括:
获取所述目标AI模型的预测准确率;
当所述预测准确率小于预设阈值时,对每种所述目标类别对应的样本数据进行更新,得到每种所述目标类别对应的更新后的样本数据,并采用所述至少一种目标类别分别对应的所述更新后的样本数据,对所述目标AI模型进行更新训练,直至所述预测准确率大于或等于所述预设阈值。
5.根据权利要求1-4任一项所述的方法,所述方法还包括:
获取所述目标AI模型在真实场景下的真实输入数据、所述真实输入数据的目标类别;
确定所述真实输入数据的目标类别对应的文本提示词;
将所述真实输入数据的目标类别对应的文本提示词作为输入、所述真实输入数据作为输出,对所述数据生成模型进行更新训练,得到更新后的数据生成模型。
6.根据权利要求1-5任一项所述的方法,所述方法还包括:
获取所述目标AI模型在真实场景下的真实输入数据、所述真实输入数据的目标类别;
将所述真实输入数据作为输入、所述真实输入数据的目标类别作为输出,对所述目标AI模型进行更新训练,得到更新后的目标AI模型。
7.一种语言模型训练方法,所述方法包括:
获取样本名称字段、所述样本名称字段对应的标注文本提示词;
将所述样本名称字段作为输入、所述样本名称字段对应的标注文本提示词作为输出,对神经网络进行训练,得到语言模型。
8.一种模型训练装置,所述装置包括:
获取单元,用于获取至少一种目标类别;
确定单元,用于确定每种所述目标类别对应的文本提示词,所述文本提示词用于描述所述目标类别的属性;
生成单元,用于分别将每种所述目标类别对应的文本提示词输入数据生成模型,通过所述数据生成模型输出每种所述目标类别对应的样本数据;
训练单元,用于采用所述至少一种目标类别分别对应的所述样本数据,对AI网络进行训练,得到目标AI模型,所述目标AI模型具有根据输入的目标数据预测所述目标数据所属的目标类别的功能。
9.根据权利要求8所述的装置,所述确定单元,还用于:
分别将每种所述目标类别的名称字段输入语言模型,通过所述语言模型输出每种所述目标类别对应的文本提示词;
其中,所述语言模型是采用样本名称字段作为输入、所述样本名称字段对应的标注文本提示词作为输出,对神经网络进行训练得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310389228.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:鼻炎仪
- 下一篇:天线系统的控制方法、装置、电子设备及存储介质