[发明专利]多模态图像的分割模型训练方法、图像处理方法及装置有效

申请号：	202010635637.3	申请日：	2020-07-03
公开（公告）号：	CN111667027B	公开（公告）日：	2022-11-11
发明（设计）人：	边成	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06V10/764	分类号：	G06V10/764;G06V10/26;G06V10/82;G06N3/04;G06N3/08;G06N20/00
代理公司：	北京市柳沈律师事务所 11105	代理人：	王娟
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	多模态图像分割模型训练方法处理装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开提供了一种用于多模态图像的分割模型的训练方法、图像处理方法、图像处理装置以及计算机可读存储介质。该训练方法包括：利用第一模态的训练图像集训练第一分割模型，其中，第一模态的训练图像集是对多个参考对象在第一模态下进行采集得到的图像的集合，第一模态的训练图像集中的每个训练图像具有第一数量的已标注类别；基于使用所训练的第一分割模型对第二模态的训练图像集进行处理得到的结果，利用第二模态的训练图像集训练第二分割模型，其中，第二模态的训练图像集是对多个参考对象在第二模态下进行采集得到的图像的集合，第二模态的训练图像集中的每个训练图像具有第二数量的已标注类别，并且第二数量小于第一数量。

技术领域

本公开涉及深度学习领域，并且具体的涉及一种用于多模态图像的分割模型的训练方法、图像处理方法、图像处理装置和计算机可读存储介质。

背景技术

机器学习(Machine Learning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科，专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

在深度学习领域中，零样本学习方法(ZSL，Zero-shot Learning)是学术界重要的前沿研究分支之一。尽管大量科研相关人员已经标注了很多标准数据集，但是其类别也是有限的。例如著名的数据集ImageNet，即使包含千万级的数据，也仅能涵盖有限个类别。在现实世界中，类别是无穷的，已经标注的数据仍然只占少数，诸如疾病图像数据难以大量获取并进行标注。因此，研究模型对无标注类别进行有效的学习并进行预测是非常有意义的。现有技术中的零样本学习方法对图像分割的精度有限，并且需采用基于自然语言处理的Word2vec模型，这使得现有方法无法应用于诸如医学图像等的非自然图像的图像分割。

发明内容

为了克服现有技术中存在的缺陷，本公开提出了一种用于多模态图像的分割模型的训练方法、图像处理方法及装置和计算机可读存储介质。

根据本公开的一个方面，提供了一种用于多模态图像的分割模型的训练方法，所述训练方法包括：利用第一模态的训练图像集训练第一分割模型，其中，所述第一模态的训练图像集是对多个参考对象在第一模态下进行采集得到的图像的集合，所述第一模态的训练图像集中的每个训练图像具有第一数量的已标注类别；基于使用所训练的第一分割模型对第二模态的训练图像集进行处理得到的结果，利用第二模态的训练图像集训练第二分割模型，其中，所述第二模态的训练图像集是对多个参考对象在第二模态下进行采集得到的图像的集合，所述第二模态的训练图像集中的每个训练图像具有第二数量的已标注类别，并且所述第二数量小于所述第一数量。

根据本公开的一个示例，其中，所述利用第一模态的训练图像集训练第一分割模型包括：对于所述第一模态的训练图像集中的每个训练图像，利用所述第一分割模型对所述训练图像中的每个类别生成预测标签；以及通过利用所述训练图像的第一数量的已标注类别中的每个类别的已标注标签对所述预测标签进行监督，来对所述第一分割模型进行有监督训练。

根据本公开的一个示例，其中，所述基于使用所训练的第一分割模型对第二模态的训练图像集进行处理得到的结果，利用第二模态的训练图像集训练第二分割模型包括：利用所训练的第一分割模型对所述第二模态的训练图像集中的每个训练图像进行处理以得到第一语义特征；利用第二分割模型对所述第二模态的训练图像集中的每个训练图像进行处理以得到第二语义特征；以及训练第二分割模型，将所述第一语义特征和所述第二语义特征对齐。

根据本公开的一个示例，其中，所述训练第二分割模型将所述第一语义特征和所述第二语义特征对齐包括：利用第一判别器对所述第二分割模型进行对抗训练，将所述第一语义特征和所述第二语义特征对齐。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于腾讯科技（深圳）有限公司，未经腾讯科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010635637.3/2.html，转载请声明来源钻瓜专利网。

上一篇：一种不锈钢面硅酸铝复合板组合拼装结构
下一篇：显示设备、视频通话方法及服务器

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]多模态图像的分割模型训练方法、图像处理方法及装置有效

专利文献下载