[发明专利]一种图像检测方法、装置、设备及可读存储介质在审
申请号: | 202210288699.0 | 申请日: | 2022-03-23 |
公开(公告)号: | CN114693624A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 项进喜;杨森;张军;蒋冬先;侯英勇;韩骁 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/194;G06K9/62;G06V10/764;G06V10/762;G06V10/774;G06V10/80 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 陈梅君 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 检测 方法 装置 设备 可读 存储 介质 | ||
本发明公开了一种图像检测方法、装置、设备及可读存储介质,该方法包括:对待检测图像进行特征提取处理,得到至少两个子图像特征;生成至少两个子图像特征分别对应的注意力权重,根据注意力权重对至少两个子图像特征进行加权聚合处理,得到第一特征向量;对至少两个子图像特征进行聚类采样处理,得到至少两个分类簇分别包含的采样子图像特征,根据至少两个分类簇和块稀疏矩阵确定每个采样子图像特征分别对应的块稀疏自注意力,根据至少两个块稀疏自注意力确定第二特征向量;根据第一特征向量和第二特征向量,确定待检测图像的分类结果。采用本发明,可以提高图像的检测速度和检测准确率。
技术领域
本申请涉及计算机技术领域,尤其涉及一种图像检测方法、装置、设备及可读存储介质。
背景技术
在经典的机器学习图像分类问题中经常假设一个图像很清楚地隶属其中一个类别。但是,在实际应用中,一个图像中会观察到多个实例(instance),而标签仅对其中一个类别有说明。这种问题一般称作多示例学习(multiple instance learning,MIL)。多示例学习的目的是通过对具有分类标签的多示例图像的学习,建立多示例学习模型,并将该多示例学习模型应用于未知多示例图像的检测。
现有技术中,可以通过自注意力模块来挖掘已有多示例图像的所有实例的信息,并从中找出实例之间的相关信息来进行建立多示例学习模型,从而检测未知多示例图像。但是自注意力模块具有高计算复杂度,对于数字化病理图像这种实例数量可能达到10000左右的多示例图像进行建模时,硬件资源和时间消耗都很大,训练困难。而且针对数字化病理图像这种数量少,且每张图像只包含一个全片的标签的多示例图像,监督信息很弱,在小数据集上训练如此高复杂度的模块较很难挖掘出有效的信息,而且容易产生过拟合,导致检测准确率低。
发明内容
本申请实施例提供了一种图像检测方法、装置、设备及可读存储介质,可以提高图像的检测速度和检测准确率。
本申请实施例一方面提供了一种图像检测方法,包括:
获取待检测图像,对待检测图像进行特征提取处理,得到用于表示待检测图像的特征表示子集;待检测图像包括至少两个子图像;特征表示子集包括至少两个子图像特征;一个子图像对应一个子图像特征;
生成至少两个子图像特征分别对应的注意力权重,根据注意力权重对至少两个子图像特征进行加权聚合处理,得到第一特征向量;
对至少两个子图像特征进行聚类采样处理,得到至少两个分类簇分别包含的采样子图像特征,根据至少两个分类簇和块稀疏矩阵确定每个采样子图像特征分别对应的块稀疏自注意力,根据至少两个块稀疏自注意力确定第二特征向量;一个采样子图像特征对应的块稀疏自注意力是基于所属分类簇中的采样子图像特征所确定的;
根据第一特征向量和第二特征向量,确定待检测图像的分类结果。
本申请实施例一方面提供了一种图像检测方法,包括:
获取样本图像,对样本图像进行特征提取处理,得到用于表示样本图像的样本特征表示子集;样本图像包括至少两个样本子图像;样本特征表示子集包括至少两个样本子图像特征;一个样本子图像对应一个样本子图像特征;
将至少两个样本子图像输入初始图像识别模型,在初始图像识别模型中,生成至少两个样本子图像特征分别对应的样本注意力权重,根据至少两个样本子图像特征分别对应的样本注意力权重,对至少两个样本子图像特征进行加权聚合处理,得到第一样本特征向量;
在初始图像识别模型中,对至少两个样本子图像特征进行聚类采样处理,得到至少两个样本分类簇分别包含的样本采样子图像特征,根据至少两个样本分类簇和块稀疏矩阵确定每个样本采样子图像特征分别对应的样本块稀疏自注意力,根据至少两个样本块稀疏自注意力确定第二样本特征向量;一个样本采样子图像特征对应的样本块稀疏自注意力是基于所属样本分类簇中的样本采样子图像特征所确定的;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210288699.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序