[发明专利]多模态数据处理方法、电子设备及存储介质在审
申请号: | 202111301728.4 | 申请日: | 2021-11-04 |
公开(公告)号: | CN114168780A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 李涵 | 申请(专利权)人: | 卓尔智联(武汉)研究院有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/55;G06F40/289;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 张雪;张颖玲 |
地址: | 432200 湖北省武汉市黄陂区盘龙城经*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多模态 数据处理 方法 电子设备 存储 介质 | ||
1.一种多模态数据处理方法,其特征在于,所述方法包括:
在神经网络模型中根据当前输入的数据确定第一特征向量和第二特征向量;所述数据包括图像模态数据和文本模态数据;
基于所述第一特征向量、所述第二特征向量分别确定第一损失值和第二损失值;所述第一损失值表征当前输入的数据的语义类别预测误差;所述第二损失值表征所述当前输入的数据与历史输入的数据之间语义相关性与距离的关联程度;所述语义相关性表示数据是否属于同一语义类别;
基于所述神经网络模型中当前输入以及历史输入的全部数据对应的特征向量确定第三损失值;所述第三损失值表征图像模态和文本模态之间的差异程度;
基于所述第一损失值、第二损失值以及第三损失值训练所述神经网络模型。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征向量、所述第二特征向量分别确定第一损失值和第二损失值,包括:
基于所述第一特征向量和所述第二特征向量在所述神经网络模型的迭代计算中得到的迭代结果,确定第一损失值;所述迭代结果包括所述第一特征向量和第二特征向量分别在多个语义类别中对应的概率;
基于所述第一特征向量、所述第二特征向量与历史输入的数据对应的其他特征向量之间的距离,确定第二损失值。
3.根据权利要求2所述的方法,其特征在于,所述在神经网络模型中根据当前输入的数据确定第一特征向量和第二特征向量,包括:
基于神经网络模型中的图像特征提取网络处理当前输入的图像模态数据,得到第一特征向量;
基于神经网络模型中的文本特征提取网络处理当前输入的文本模态数据,得到第二特征向量;
所述方法还包括:
基于所述图像特征提取网络的层数和神经元权重,以及所述文本特征提取网络的层数和神经元权重,确定表征所述神经网络模型拟合程度的第四损失值;
所述基于所述第一损失值、第二损失值以及第三损失值训练所述神经网络模型,包括:
基于所述第一损失值、第二损失值、第三损失值以及第四损失值,对所述神经网络模型的参数进行更新。
4.根据权利要求3所述的方法,其特征在于,所述基于神经网络模型中的图像特征提取网络处理当前输入的图像模态数据,得到第一特征向量,包括:
将当前输入的图像模态数据分割为预设数量的图像模态子数据;
基于神经网络模型中的图像特征提取网络处理所述预设数量的图像模态子数据,得到第一特征向量。
5.根据权利要求3所述的方法,其特征在于,所述基于所述第一特征向量和所述第二特征向量在所述神经网络模型的迭代计算中得到的迭代结果,确定第一损失值,包括:
获取用于计算第一损失值的网络对应的第一网络参数;
基于所述第一网络参数,以及所述第一特征向量和所述第二特征向量在所述神经网络模型的迭代计算中得到的迭代结果,确定第一损失值;
所述基于所述第一特征向量、所述第二特征向量与历史输入的数据对应的其他特征向量之间的距离,确定第二损失值,包括:
获取所述神经网络模型中的图像模态参数和文本模态参数;
在历史输入的数据对应的其他特征向量中,分别确定所述第一特征向量和所述第二特征向量的参照特征向量;所述参照特征向量包括语义相关的特征向量以及语义无关的特征向量;
基于所述图像模态参数和文本模态参数,分别计算所述第一特征向量、所述第二特征向量与所述参照特征向量之间的距离;
基于所述距离确定第二损失值。
6.根据权利要求5所述的方法,其特征在于,所述基于所述神经网络模型中当前输入以及历史输入的全部数据对应的特征向量确定第三损失值,包括:
获取用于计算第三损失值的网络对应的第二网络参数;
基于所述第二网络参数以及所述神经网络模型中当前输入和历史输入的全部数据对应的特征向量,确定第三损失值;
所述基于所述第一损失值、第二损失值、第三损失值以及第四损失值,对所述神经网络模型的参数进行更新,包括:
基于所述第一损失值、第二损失值、第三损失值以及第四损失值,对所述第一网络参数、图像模态参数、文本模态参数以及第二网络参数进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卓尔智联(武汉)研究院有限公司,未经卓尔智联(武汉)研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111301728.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于物联网与云计算技术的智慧能源管理平台
- 下一篇:一种新型测功机