[发明专利]机器学习模型训练方法和装置、场景图生成方法和装置在审
申请号: | 202211519169.9 | 申请日: | 2022-11-30 |
公开(公告)号: | CN115908850A | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 詹忆冰;林鑫 | 申请(专利权)人: | 京东科技信息技术有限公司 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/774;G06V10/82;G06F17/16;G06N3/0464;G06N3/08 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 刘剑波;许蓓 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器 学习 模型 训练 方法 装置 场景 生成 | ||
1.一种机器学习模型训练方法,包括:
提取样本图像中的第一目标特征信息;
利用第一机器学习模型对所述第一目标特征信息和预设的重加权系数进行信息传递处理,以得到所述样本图像的第二目标特征信息;
利用所述样本图像的第二目标特征信息生成第一场景图;
利用所述第一场景图和所述样本图像的标注结果,生成第一损失函数;
利用第一损失函数对所述第一机器学习模型进行训练。
2.根据权利要求1所述的方法,其中,所述利用第一机器学习模型对所述第一目标特征信息和预设的重加权系数进行信息传递处理包括:
利用所述第一目标特征信息和所述重加权系数生成目标关联矩阵;
利用所述第一目标特征信息和所述目标关联矩阵生成所述第二目标特征信息。
3.根据权利要求2所述的方法,其中,
所述目标关联矩阵与所述重加权系数和所述第一目标特征信息的注意力评分结果的哈达玛Hadamard乘积相关联;
所述第二目标特征信息与所述第一目标特征信息、所述目标关联矩阵与所述第一目标特征信息的乘积和预设目标特征信息之和相关联。
4.根据权利要求3所述的方法,其中,
所述目标关联矩阵A(k+1)为:
A(k+1)=Normalize(Ω(k)⊙H(Y(k)))
其中,Normalize为归一化函数,Ω(k)为所述重加权系数,Y(k)为所述第一目标特征信息,H为注意力评分函数,⊙为Hadamard乘法算符;
所述第二目标特征信息Y(k+1)为:
Y(k+1)=AF1(a(Y(k)+A(k+1)Y(k)+Y(0)))
其中,AF1为激活函数,a为系数,Y(0)为所述预设目标特征信息。
5.根据权利要求1-4中任一项所述的方法,还包括:
利用所述第二机器学习模型对所述第二目标特征信息进行处理,以生成关系预测矩阵,其中所述关系预测矩阵中包括所述样本图像中每两个目标之间的关系预测特征;
确定所述关系预测矩阵的最大秩;
根据所述关系预测矩阵确定所述样本图像中各目标关系预测结果的交叉熵损失函数;
根据所述交叉熵损失函数和所述关系预测矩阵的最大秩生成第二损失函数;
利用第二损失函数对所述第一机器学习模型和所述第二机器学习模型进行训练。
6.根据权利要求5所述的方法,其中,
所述第二特征信息包括所述样本图像中的每一个目标的目标特征,以及所述样本图像中的每两个特征的联合特征。
7.根据权利要求6所述的方法,其中,
所述样本图像中第i个目标和第j个目标之间的关系预测特征与所述第i个目标的目标特征、所述第j个目标的目标特征、以及所述第i个目标和所述第j个目标的联合特征相关联,1≤i,j≤M,i≠j。
8.根据权利要求7所述的方法,其中,
所述第i个目标和所述第j个目标之间的关系预测特征Pij为:
Pij=AF2(Wr(yi*yj*uij)+fij)
其中,AF2为激活函数,Wr为关系预测函数,yi为所述第i个目标的目标特征,yj为所述第j个目标的目标特征,uij为所述第i个目标和所述第j个目标的联合特征,fij为所述第i个目标和所述第j个目标之间的关系类别的概率分布,*为特征融合算符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技信息技术有限公司,未经京东科技信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211519169.9/1.html,转载请声明来源钻瓜专利网。