[发明专利]图像消歧方法、装置、存储介质和电子设备有效
申请号: | 201710278676.0 | 申请日: | 2017-04-25 |
公开(公告)号: | CN108205684B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 汤晓鸥;李亦宁;黄琛;吕健勤 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06V10/80;G06K9/62;G06F16/583;G06F16/783 |
代理公司: | 北京中知恒瑞知识产权代理事务所(普通合伙) 11889 | 代理人: | 陈晓川 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 方法 装置 存储 介质 电子设备 | ||
1.一种图像消歧方法,其特征在于,包括:
对包含相似目标的图像集合中的各图像进行图像特征提取和语义识别,得到N个K维语义特征概率向量,其中,所述图像集合包括N个图像,N和K均为正整数,且N大于或等于2;
根据所述N个K维语义特征概率向量确定差异特征组合,所述差异特征组合用于描述图像集合中各图像相似目标之间的区别;
根据所述差异特征组合和所述图像集合中的各图像的图像特征,生成用于表示或提示所述图像集合中各图像中相似目标之间的至少一个语义特征的区别的提问式自然语言;
所述根据所述N个K维语义特征概率向量确定差异特征组合,包括:
分别从所述各图像中选择任一语义特征概率向量进行组合,得到KN个特征组合;
根据所述KN个特征组合中的语义特征的置信概率、语义特征的类型、语义特征的差别中的至少一种语义特征信息,对所述KN个特征组合分别进行所述图像集合中各图像相似目标之间的区别描述能力的评分;
根据评分结果确定所述KN个特征组合中的部分特征组合为所述差异特征组合。
2.根据权利要求1所述的方法,其特征在于,所述对包含相似目标的图像集合中的各图像进行图像特征提取和语义识别,得到N个K维语义特征概率向量,包括:
基于深度神经网络提取所述图像集合中各图像的图像特征;
根据提取的各图像特征并基于多层感知器对各图像进行语义识别,得到所述N个K维语义特征概率向量。
3.根据权利要求1所述的方法,其特征在于,所述根据评分结果确定所述KN个特征组合中的部分特征组合为所述差异特征组合,包括:
将所述评分结果中分数最高的特征组合确定为所述差异特征组合,或者,将所述评分结果中分数高于预定阈值的一个或者多个特征组合确定为所述差异特征组合。
4.根据权利要求1所述的方法,其特征在于,在评分时依据多种语义特征信息的情形下,所述对所述KN个特征组合分别进行所述图像集合中各图像相似目标之间的区别描述能力的评分,还包括:
将所述KN个特征组合中同一特征组合的所述多种语义特征信息分别对应的评分合并或加权合并,得到每个特征组合的评分结果。
5.根据权利要求1-4任一所述的方法,其特征在于,所述根据所述差异特征组合和所述图像集合中的各图像的图像特征,生成用于表示或提示所述图像集合中各图像中相似目标之间的至少一个语义特征的区别的提问式自然语言,包括:
根据所述差异特征组合和所述图像集合中的各图像的图像特征,并基于长短记忆单元递归神经网络对各图像进行自然语言识别,生成所述用于表示或提示所述图像集合中各图像中相似目标之间的至少一个语义特征的区别的提问式自然语言。
6.根据权利要求1-5任一所述的方法,其特征在于,在所述生成用于表示或提示所述图像集合中各图像中相似目标之间的至少一个语义特征的区别的自然语言之后,所述方法还包括:
接收针对所述提问式自然语言的回复信息;
根据所述回复信息生成新的自然语言,和/或,根据所述回复信息在所述图像集合中确定目标图像。
7.根据权利要求1-6任一所述的方法,其特征在于,所述对包含相似目标的图像集合中的各图像进行图像特征提取和语义识别之前,还包括:
接收图像或视频的搜索信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710278676.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序