[发明专利]图像识别方法、装置、计算机设备及计算机可读存储介质有效
申请号: | 201910497448.1 | 申请日: | 2019-06-10 |
公开(公告)号: | CN110210571B | 公开(公告)日: | 2023-01-06 |
发明(设计)人: | 龚丽君 | 申请(专利权)人: | 腾讯医疗健康(深圳)有限公司 |
主分类号: | G06V10/77 | 分类号: | G06V10/77;G06V10/40 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 计算机 设备 可读 存储 介质 | ||
本发明公开了一种图像识别方法、装置、计算机设备及计算机可读存储介质,属于图像技术领域。本发明通过目标识别模型对待识别的图像进行特征提取,获取该图像对应的第一特征图,对该第一特征图进行可形变卷积处理,使该目标识别模型可以全面捕捉到尺寸和形状差异较大的目标区域,该目标识别模型基于可形变卷积后的第一特征图生成第二特征图,通过注意力机制对该第二特征图中的关键信息进行提取,使该目标识别模型更加关注目标区域,从而可以准确获取到该图像中的各个目标区域。这种图像识别方法提高了目标识别模型对不同尺寸和形状的目标区域的识别能力,且通过注意力机制使该目标识别模型更加关注重要的目标区域,从而提高了识别结果的准确率。
技术领域
本发明涉及图像技术领域,特别涉及一种图像识别方法、装置、计算机设备及计算机可读存储介质。
背景技术
随着机器学习技术的发展,计算机设备可以基于深度神经网络构建目标识别模型,对图像中包含的目标信息进行识别,例如,在临床医学领域,计算机设备可以通过目标识别模型自动识别出眼底图像中的病灶。目前,在图像识别任务中,通常采用YOLO(youonly look once,你只看一次)目标识别模型,对图像进行特征提取,获取图像对应的特征图,基于该特征图预测图像中的目标区域的位置信息、类别信息等。
但是,在图像中通常会存在大小和形状差异较大的目标,YOLO目标识别模型对于这些尺寸和形状悬殊巨大的目标的信息提取能力较差,导致检测结果的准确率较低。
发明内容
本发明实施例提供了一种图像识别方法,可以解决相关技术中图像识别准确率低的问题。所述技术方案如下:
一方面,提供了一种图像识别方法,所述方法包括:
获取待识别的图像;
将该图像输入目标识别模型中,由该目标识别模型对该图像进行特征提取,基于提取到的第一特征图以及多个不同的可形变卷积核获取第二特征图,基于该第二特征图进行关键信息提取,得到第三特征图,基于该第三特征图输出该图像的至少一个目标区域的位置信息以及置信度;
根据该至少一个目标区域的位置信息以及置信度,在该图像中突出显示该至少一个目标区域。
在一种可能实现方式中,该基于提取到的第一特征图以及多个不同的可形变卷积核获取第二特征图,包括:
将该第一特征图与该多个不同的可形变卷积核分别进行卷积运算,得到多个中间特征图;
根据该多个不同的可形变卷积核的通道权重和该多个中间特征图进行加权运算,得到该第二特征图。
在一种可能实现方式中,该将该第一特征图与该多个不同的可形变卷积核分别进行卷积运算,得到多个中间特征图包括:
在任一个可形变卷积核与该第一特征图的运算过程中,当扫描窗口扫描至该第一特征图的子图上,基于该子图中的各个第一特征点的位置,在该子图中确定各个第一特征点进行偏移后的第二特征点,将该各个第二特征点与该可形变卷积核中对应的权重进行点乘运算,输出该中间特征图中的一个特征点。
在一种可能实现方式中,该基于该第二特征图进行关键信息提取,得到第三特征图包括:
当扫描窗口扫描至该第二特征图的任一个子图上时,获取位于该扫描窗口内的最大值,将获取到的最大值输出为该第三特征图的一个特征点。
在一种可能实现方式中,该基于该第三特征图输出该图像的至少一个目标区域的位置信息以及置信度包括:
基于该第三特征图生成至少一个特征向量,每个特征向量用于指示一个区域的位置信息、类别置信度以及区域置信度。
在一种可能实现方式中,该根据该至少一个目标区域的位置信息以及置信度,在该图像中突出显示该至少一个目标区域包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯医疗健康(深圳)有限公司,未经腾讯医疗健康(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910497448.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序