[发明专利]一种图像识别方法、装置、设备及存储介质在审
申请号: | 202010766862.0 | 申请日: | 2020-08-03 |
公开(公告)号: | CN112069892A | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 丁贵广;何宇巍 | 申请(专利权)人: | 清华大学;北京达佳互联信息技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郝志国 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 识别 方法 装置 设备 存储 介质 | ||
1.一种图像识别方法,其特征在于,包括:
对待识别图像进行初始语义识别,得到图像语义特征;以及从所述图像语义特征中获取目标语义特征,所述目标语义特征包括所述图像语义特征中针对目标语义的特征;
基于非目标语义特征对所述目标语义特征的影响值,对所述目标语义特征进行调整,所述非目标语义特征包括所述图像语义特征中除所述目标语义特征外的语义特征;以及
基于调整后的目标语义特征,得到针对所述待识别图像中所述目标语义的识别语义特征;
利用预设的历史图像的识别语义特征和图像类型的第一关联度,估计所述待识别图像的识别语义特征与图像类型的第二关联度,将估计的第二关联度转换为所述待识别图像包含所述目标语义的概率参数,其中所述图像类型是根据所述历史图像中是否包含所述目标语义确定的。
2.如权利要求1所述的方法,其特征在于,所述待识别图像包括待识别视频中的视频帧,所述将估计的第二关联度转换为所述待识别图像包含所述目标语义的概率参数的步骤之后,还包括:
将所述待识别视频中的视频帧包含所述目标语义的概率参数的最大值,确定为所述待识别视频包含所述目标语义的概率参数。
3.如权利要求1所述的方法,其特征在于,所述基于调整后的目标语义特征,得到针对所述待识别图像中所述目标语义的识别语义特征的步骤,包括:
将所述调整后的目标语义特征,确定为针对所述待识别图像中所述目标语义的识别语义特征;或
对所述调整后的目标语义特征和所述图像语义特征进行整合处理,得到针对所述待识别图像中所述目标语义的识别语义特征。
4.如权利要求1-3任一项所述的方法,其特征在于,基于非目标语义特征对所述目标语义特征的影响值,对所述目标语义特征进行调整的步骤,包括:
通过目标网络中的每个转换单元,进行如下步骤对所述目标语义特征进行调整:
通过注意力机制,确定各非目标语义特征对所述目标语义特征的影响值;
利用所述各非目标语义特征对所述目标语义特征的影响值,对所述各非目标语义特征进行加权求和处理,得到加权后的语义特征;
将所述加权后的语义特征和所述目标语义特征进行整合处理,得到所述待识别图像对应的调整后的目标语义特征;
其中,所述目标网络包括至少一个转换单元,若所述目标网络中包括串联的多个转换单元,则第i个转换单元使用的目标语义向量,是第i-1个转换单元得到的调整后的目标语义特征;所述待识别图像对应的调整后的目标语义特征,为所述多个转换单元中最末位置的转换单元得到的调整后的目标语义特征,所述i为大于1的整数。
5.如权利要求4所述的方法,其特征在于,所述通过注意力机制,确定各非目标语义特征对所述目标语义特征的影响值的步骤,包括:
将所述各非目标语义特征的语义权重向量与所述目标语义特征的目标语义向量进行点积的结果,确定为所述各非目标语义特征对所述目标语义特征的影响值;
所述利用所述各非目标语义特征对所述目标语义特征的影响值,对所述各非目标语义特征进行加权求和处理,得到加权后的语义特征的步骤,包括:
利用所述各非目标语义特征对所述目标语义特征的影响值,对所述各非目标语义特征的语义特征向量进行加权求和处理,得到加权后的语义特征。
6.如权利要求5所述的方法,其特征在于,所述通过注意力机制,确定各非目标语义特征对所述目标语义特征的影响值的步骤之前,还包括
通过第一基本神经网络对所述目标语义特征进行处理,得到第一个转换单元中使用的所述目标语义向量,所述第一基本神经网络包括第一设定卷积核大小的卷积层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;北京达佳互联信息技术有限公司,未经清华大学;北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010766862.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序