[发明专利]基于隐藏表征和深度生成对抗模型的多模态数据处理系统和方法有效
申请号: | 201910864554.9 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110580509B | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 杨光;牛张明;陆纬;江荧辉;李劳;王承嘉;叶旭冏;董豪;方飞 | 申请(专利权)人: | 杭州海睿博研科技有限公司;帝工(杭州)科技产业有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 上海智晟知识产权代理事务所(特殊普通合伙) 31313 | 代理人: | 张东梅 |
地址: | 310018 浙江省杭州市经济技术*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 隐藏 表征 深度 生成 对抗 模型 多模态 数据处理系统 方法 | ||
1.一种基于隐藏表征和深度生成对抗模型的多模态数据处理方法,包括:
使用深度神经网络学习多模态数据的隐藏表征,其中深度神经网络的学习模型为:
其中是所有样本的隐藏表征矩阵,Wv是第v个模态的特征投影矩阵,P是标签投影矩阵,β、γ、λ和η是正则化参数,Ev是第v个模态的稀疏误差矩阵,XV表示第v个模态的特征矩阵,Xv包括完整的多模态数据和不完整的多模态数据Xv的相应标签由给出;拉普拉斯矩阵给出Lv=Dv-Sv,Dv是一个对角矩阵,其第i个对角线元素表示在Sv中第i行的总和; Sv是第v个模态的相似性矩阵,其第(i,j)个元素以给出,其中Xv,:i和Xv,:j分别表示Xv的第i列和第j列,并且根据经验设定σ=1;
如果多模态数据有部分数据遗失,通过深度生成对抗模型GAN生成缺失数据,协同隐藏表征共同生成图像数据,其中通过深度生成对抗模型GAN生成缺失数据,协同隐藏表征共同生成图像数据包括:通过使用RIED-Net对输入数据进行处理,RIED-Net包含9个残差起始块,编码路径中有5个残差起始块,解码路径中有4个残差起始块,在每一个残差起始块中,输入为给定输入图像或特征映射x,存在具有3个卷积层的主路径和从第一层到最后一层的残差起始路径,主路径获得残差映射F(x),在残差起始路径上实施1×1卷积层获得x的投影G(x),并且将主路径和残差起始路径按像素求和形成组合输出F(x)+G(x)。
2.如权利要求1所述的基于隐藏表征和深度生成对抗模型的多模态数据处理方法,其特征在于,所述多模态数据包括图像数据和生物样本库数据。
3.如权利要求1所述的基于隐藏表征和深度生成对抗模型的多模态数据处理方法,其特征在于,所述多模态数据包括完整多模态数据和不完整多模态数据。
4.如权利要求3所述的基于隐藏表征和深度生成对抗模型的多模态数据处理方法,其特征在于,利用具有完整多模态数据的样本来获取共同的隐藏表征;
利用具有不完整多模态数据的样本来获取每个模态专有的隐藏表征;
将所有的隐藏表征被投影到标签空间用于图像合成。
5.一种基于隐藏表征和深度生成对抗模型的多模态数据处理系统,包括:
隐藏表征生成单元,所述隐藏表征生成单元使用深度神经网络学习多模态数据的隐藏表征,其中深度神经网络的学习模型为:
其中是所有样本的隐藏表征矩阵,Wv是第v个模态的特征投影矩阵,P是标签投影矩阵,β、γ和λ是正则化参数,Ev是第v个模态的稀疏误差矩阵,XV表示第v个模态的特征矩阵,Xv包括完整的多模态数据和不完整的多模态数据Xv的相应标签由给出;拉普拉斯矩阵给出Lv=Dv-Sv,Dv是一个对角矩阵,其第i个对角线元素表示在Sv中第i行的总和; Sv是第v个模态的相似性矩阵,其第(i,j)个元素以给出,其中Xv,:i和Xv,:j分别表示Xv的第i列和第j列,并且根据经验设定σ=1;
图像生成单元,所述图像生成单元通过深度生成对抗模型GAN生成缺失数据,协同隐藏表征共同生成图像数据,
其中图像生成单元通过使用RIED-Net对输入数据进行处理,RIED-Net包含9个残差起始块,编码路径中有5个残差起始块,解码路径中有4个残差起始块,在每一个残差起始块中,输入为给定输入图像或特征映射x,存在具有3个卷积层的主路径和从第一层到最后一层的残差起始路径,主路径获得残差映射F(x),在残差起始路径上实施1×1卷积层获得x的投影G(x),并且将主路径和残差起始路径按像素求和形成组合输出F(x)+G(x)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海睿博研科技有限公司;帝工(杭州)科技产业有限公司,未经杭州海睿博研科技有限公司;帝工(杭州)科技产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910864554.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:视频分类方法、装置、存储介质和移动终端
- 下一篇:一种聚类结果评价方法和系统