[发明专利]模型训练方法、分类信息生成方法、装置、设备和介质在审
申请号: | 202310560745.2 | 申请日: | 2023-05-17 |
公开(公告)号: | CN116644346A | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 潘滢炜;姚霆;梅涛 | 申请(专利权)人: | 京东科技控股股份有限公司 |
主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F18/214;G06N3/0464;G06F17/16 |
代理公司: | 北京唯智勤实知识产权代理事务所(普通合伙) 11557 | 代理人: | 姜悦 |
地址: | 102600 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 分类 信息 生成 装置 设备 介质 | ||
本公开的实施例公开了模型训练方法、分类信息生成方法、装置、设备和介质。该方法的一具体实施方式包括:响应于确定模型训练未达到预定训练阶段,生成初始域独占特征信息;生成初始正交损失信息;对初始域独占特征识别模型、独占特征权重矩阵和域不变特征权重矩阵进行参数初步更新;响应于确定模型训练达到预定训练阶段,生成初步域独占特征信息,以及生成初始域不变特征信息;根据初步域独占特征信息、初始域不变特征信息、更新后独占特征权重矩阵和更新后域不变特征权重矩阵,对初步更新后的分类模型进行模型训练。该实施方式与人工智能有关,利用训练得到的分类模型,可以准确地实现针对各种模态形式的数据的数据分类。
技术领域
本公开的实施例涉及计算机技术领域,具体涉及模型训练方法、分类信息生成方法、装置、设备和介质。
背景技术
目前,深度学习神经网络在各种计算机视觉任务上都取得了突破性的进展。对于分类模型的训练,通常采用的方式为:首先,基于不同的数据增强算法,生成不同分布的伪训练数据集。然后,结合现有域泛化技术,实现分类模型的模型训练。
然而,发明人发现,当采用上述方式来训练模型,经常会存在如下技术问题:
由于仅能针对图像模态的数据进行数据增强处理,导致分类模型仅能对图像模态的数据进行分类。使得针对其他模态的数据,不能准确地进行分类。
该背景技术部分中所公开的以上信息仅用于增强对本发明构思的背景的理解,并因此,其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开的一些实施例提出了模型训练方法、分类信息生成方法、装置、设备和介质,来解决以上背景技术部分提到的技术问题。
第一方面,本公开的一些实施例提供了一种模型训练方法,包括:响应于确定初始分类模型的模型训练未达到预定训练阶段,利用初始域独占特征识别模型,生成针对第一数据的初始域独占特征信息,其中,上述初始分类模型包括:上述初始域独占特征识别模型和初始域不变特征识别模型;生成针对独占特征权重矩阵和域不变特征权重矩阵的初始正交损失信息;根据上述初始正交损失信息和针对上述初始域独占特征信息的域独占特征损失信息,对上述初始域独占特征识别模型、上述独占特征权重矩阵和上述域不变特征权重矩阵进行参数初步更新;响应于确定初步更新后的分类模型的模型训练达到上述预定训练阶段,利用初步更新后的域独占特征识别模型,生成针对第二数据的初步域独占特征信息,以及利用上述初始域不变特征识别模型,生成针对上述第二数据的初始域不变特征信息;根据上述初步域独占特征信息、上述初始域不变特征信息、更新后独占特征权重矩阵和更新后域不变特征权重矩阵,对上述初步更新后的分类模型进行模型训练。
可选地,上述初始域独占特征识别模型包括:初始特征提取模型和初始多头偏见分类模型;以及上述利用初始域独占特征识别模型,生成针对第一数据的初始域独占特征信息,包括:将上述第一数据输入至上述初始特征提取模型,以输出第一数据特征信息;将上述第一数据特征信息输入至上述初始多头偏见分类模型,以输出上述初始域独占特征信息。
可选地,上述根据上述初始正交损失信息和针对上述初始域独占特征信息的域独占特征损失信息,对上述初始域独占特征识别模型、上述独占特征权重矩阵和上述域不变特征权重矩阵进行参数初步更新,包括:根据上述初始正交损失信息和上述域独占特征损失信息,生成模型训练损失信息;根据上述模型训练损失信息,对上述初始特征提取模型、上述初始多头偏见分类模型、上述独占特征权重矩阵和上述域不变特征权重矩阵进行参数初步更新,得到更新后特征提取模型、更新后多头偏见分类模型、上述更新后独占特征权重矩阵和上述更新后域不变特征权重矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技控股股份有限公司,未经京东科技控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310560745.2/2.html,转载请声明来源钻瓜专利网。