[发明专利]模型训练方法和语言模型训练方法及装置在审
申请号: | 202310389228.3 | 申请日: | 2023-04-12 |
公开(公告)号: | CN116401551A | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 郭明坤 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/24;G06N3/08;G06V10/774;G06V10/764;G06V10/82 |
代理公司: | 北京市通商律师事务所 11951 | 代理人: | 许念如 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 语言 装置 | ||
本公开提供一种模型训练方法和语言模型训练方法及装置,涉及人工智能技术领域,具体涉及深度学习、数据生成等技术领域,可应用于模型训练、模型优化等场景下,具体实现方案包括:获取至少一种目标类别;确定每种目标类别对应的文本提示词,文本提示词用于描述目标类别的属性;分别将每种目标类别对应的文本提示词输入数据生成模型,通过数据生成模型输出每种目标类别对应的样本数据;采用至少一种目标类别分别对应的样本数据,对AI网络进行训练,得到目标AI模型。本公开可以在前期没有训练数据的条件下,利用数据生成模型生成丰富的样本数据对AI网络进行训练,解决数据缺乏的问题。
技术领域
本公开涉及人工智能技术领域,具体涉及深度学习、数据生成等技术领域,可应用于模型训练、模型优化等场景下,尤其涉及一种模型训练方法和语言模型训练方法及装置。
背景技术
人工智能(artificial intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。AI有三大核心要素:算法、算力、数据。其中,对于算力层面,经过AI芯片的不断升级,算力已有大幅提升。对于算法层面,分类、检测、分割等优良的算法层出不穷,可以满足多种场景的应用需求。对于数据层面,数据量级影响了AI算法的效果。
目前,在训练AI模型实现目标功能时,需要先获取训练数据,并对训练数据进行标注后,采用标注后的训练数据对AI网络进行训练,才能得到可以实现目标功能的AI模型。训练数据越丰富,AI模型的效果越好。当缺乏训练数据时,无法训练得到AI模型。
发明内容
本公开提供了模型训练方法和语言模型训练方法、装置、设备及存储介质,可以在前期没有训练数据的条件下,利用数据生成模型生成丰富的样本数据对AI网络进行训练,解决数据缺乏的问题。
根据本公开的第一方面,提供了一种模型训练方法,所述方法包括:
获取至少一种目标类别;确定每种目标类别对应的文本提示词,文本提示词用于描述目标类别的属性;分别将每种目标类别对应的文本提示词输入数据生成模型,通过数据生成模型输出每种目标类别对应的样本数据;采用至少一种目标类别分别对应的样本数据,对AI网络进行训练,得到目标AI模型,目标AI模型具有根据输入的目标数据预测目标数据所属的目标类别的功能。
根据本公开的第二方面,提供了一种语言模型训练方法,所述方法包括:
获取样本名称字段、样本名称字段对应的标注文本提示词;将样本名称字段作为输入、样本名称字段对应的标注文本提示词作为输出,对神经网络进行训练,得到语言模型。
根据本公开的第三方面,提供了一种模型训练装置,所述装置包括:获取单元、确定单元、生成单元、训练单元。
获取单元,用于获取至少一种目标类别;确定单元,用于确定每种目标类别对应的文本提示词,文本提示词用于描述目标类别的属性;生成单元,用于分别将每种目标类别对应的文本提示词输入数据生成模型,通过数据生成模型输出每种目标类别对应的样本数据;训练单元,用于采用至少一种目标类别分别对应的样本数据,对AI网络进行训练,得到目标AI模型,目标AI模型具有根据输入的目标数据预测目标数据所属的目标类别的功能。
根据本公开的第四方面,提供了一种语言模型训练装置,所述装置包括:获取单元、训练单元。
获取单元,用于获取样本名称字段、所述样本名称字段对应的标注文本提示词;训练单元,用于将所述样本名称字段作为输入、所述样本名称字段对应的标注文本提示词作为输出,对神经网络进行训练,得到语言模型。
根据本公开的第五方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面或者第二方面所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310389228.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:鼻炎仪
- 下一篇:天线系统的控制方法、装置、电子设备及存储介质