[发明专利]模型训练方法及装置在审
申请号: | 202010526776.2 | 申请日: | 2020-06-09 |
公开(公告)号: | CN111680636A | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 熊凯 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 曾红芳 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 | ||
1.一种模型训练方法,其特征在于,包括:
确定第一模型和第二模型;
确定预定样本对在所述第一模型下的第一距离,以及确定所述预定样本对在所述第二模型下的第二距离;
根据所述第一距离和所述第二距离,构造所述第二模型的损失函数;
通过优化所述损失函数,对所述第二模型进行训练。
2.根据权利要求1所述的方法,其特征在于,通过优化所述损失函数,对所述第二模型进行训练包括:
通过保持所述损失函数中所述第一模型的参数不变,优化所述损失函数中所述第二模型的参数,对所述第二模型进行训练。
3.根据权利要求2所述的方法,其特征在于,根据所述第一距离和所述第二距离,构造的所述损失函数用于:在所述预定样本对为正样本对的情况下,要求所述第一距离大于所述第二距离;在所述预定样本对为负样本对的情况下,要求所述第二距离大于所述第一距离。
4.根据权利要求3所述的方法,其特征在于,根据所述第一距离和所述第二距离,构造所述第二模型的损失函数包括:
通过以下公式构造所述第二模型的损失函数:
其中,Lcdo为所述损失函数的损失值;y为所述预定样本对(Ii,Ij)的标签,y=1表示正样本对,y=0表示负样本对;为所述第二距离;为所述第一距离;为所述预定样本对(Ii,Ij)采用所述第一模型提取的特征对;为所述预定样本对(Ii,Ij)采用所述第二模型提取的特征对。
5.根据权利要求2所述的方法,其特征在于,根据所述第一距离和所述第二距离,构造所述第二模型的损失函数包括:
确定距离间隔;
根据所述第一距离,所述第二距离以及所述距离间隔,构造所述第二模型的损失函数。
6.根据权利要求5所述的方法,其特征在于,根据所述第一距离,所述第二距离以及所述距离间隔,构造的所述损失函数用于:在所述预定样本对为正样本对的情况下,要求所述第一距离大于所述第二距离与所述距离间隔之和,在所述预定样本对为负样本对的情况下,要求所述第二距离大于所述第一距离与所述距离间隔之和。
7.根据权利要求6所述的方法,其特征在于,根据所述第一距离,所述第二距离以及所述距离间隔,构造所述第二模型的损失函数包括:
通过以下公式构造所述第二模型的损失函数:
其中,Lcdo为所述损失函数的损失值;y为所述预定样本对(Ii,Ij)的标签,y=1表示正样本对,y=0表示负样本对;为所述第二距离;为所述第一距离;为所述预定样本对(Ii,Ij)采用所述第一模型提取的特征对;为所述预定样本对(Ii,Ij)采用所述第二模型提取的特征对;σ为所述距离间隔。
8.根据权利要求1所述的方法,其特征在于,通过优化所述损失函数,对所述第二模型进行训练包括:
在优化所述损失函数时结合优化其它损失函数,对所述第二模型进行训练,其中,所述其它损失函数包括以下至少之一:三元组损失函数,交叉熵损失函数。
9.根据权利要求1所述的方法,其特征在于,通过优化所述损失函数,对所述第二模型进行训练包括:
在所述预定样本对为批量样本对的情况下,对所述批量样本对所包括的多个样本对的损失值求平均,得到平均损失值,其中,多个样本对中每个样本对的损失值根据所述损失函数得到;
根据所述平均损失值,对所述第二模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010526776.2/1.html,转载请声明来源钻瓜专利网。