[发明专利]图像消歧方法、装置、存储介质和电子设备有效
申请号: | 201710278676.0 | 申请日: | 2017-04-25 |
公开(公告)号: | CN108205684B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 汤晓鸥;李亦宁;黄琛;吕健勤 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06V10/80;G06K9/62;G06F16/583;G06F16/783 |
代理公司: | 北京中知恒瑞知识产权代理事务所(普通合伙) 11889 | 代理人: | 陈晓川 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 方法 装置 存储 介质 电子设备 | ||
本发明实施例提供了一种图像消歧方法、装置、存储介质和电子设备,其中,所述方法包括:对包含相似目标的图像集合中的各图像进行图像特征提取和语义识别,得到N个K维语义特征概率向量,其中,所述图像集合包括N个图像,N和K均为正整数,且N大于或等于2;根据所述N个K维语义特征概率向量确定差异特征组合,所述差异特征组合用于描述图像集合中各图像相似目标之间的区别;根据所述差异特征组合和所述图像集合中的各图像的图像特征,生成用于表示或提示所述图像集合中各图像中相似目标的区别的自然语言。本发明实施例提升了图像消歧的效果。
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及一种图像消歧方法、装置、存储介质和电子设备。
背景技术
近年来,随着人工智能技术的普及与发展,利用计算机对图像进行处理被应用到越来越多的场景当中。图像消歧作为一种图像处理手段能够为用户提供很多方便,例如对包含相似目标的图像进行处理,目的是对图像中的相似目标进行区分。
发明内容
本发明实施例提供了图像消歧方法、装置、存储介质和电子设备技术方案。
根据本发明实施例的第一方面,提供了一种图像消歧方法,包括:对包含相似目标的图像集合中的各图像进行图像特征提取和语义识别,得到N个K维语义特征概率向量,其中,所述图像集合包括N个图像,N和K均为正整数,且N大于或等于2;根据所述N个K维语义特征概率向量确定差异特征组合,所述差异特征组合用于描述图像集合中各图像相似目标之间的区别;根据所述差异特征组合和所述图像集合中的各图像的图像特征,生成用于表示或提示所述图像集合中各图像中相似目标的区别的自然语言。
可选地,所述自然语言包括:至少一条提问形式的自然语言。
可选地,所述对包含相似目标的图像集合中的各图像进行图像特征提取和语义识别,得到N个K维语义特征概率向量,包括:基于深度神经网络提取所述图像集合中各图像的图像特征;根据提取的各图像特征并基于多层感知器对各图像进行语义识别,得到所述N个K维语义特征概率向量。
可选地,所述根据所述N个K维语义特征概率向量确定差异特征组合,包括:分别从所述各图像中选择任一语义特征概率向量进行组合,得到KN个特征组合;对所述KN个特征组合分别进行所述图像集合中各图像相似目标之间的区别描述能力的评分;根据评分结果确定所述KN个特征组合中的部分特征组合为所述差异特征组合。
可选地,所述根据评分结果确定所述KN个特征组合中的部分特征组合为所述差异特征组合,包括:将所述评分结果中分数最高的特征组合确定为所述差异特征组合,或者,将所述评分结果中分数高于预定阈值的一个或者多个特征组合确定为所述差异特征组合。
可选地,所述对所述KN个特征组合分别进行所述图像集合中各图像相似目标之间的区别描述能力的评分,包括:根据所述KN个特征组合的至少一种语义特征信息,对所述KN个特征组合分别进行所述图像集合中各图像相似目标之间的区别描述能力的评分。
可选地,所述根据所述KN个特征组合的至少一种语义特征信息,对所述KN个特征组合分别进行所述图像集合中各图像相似目标之间的区别描述能力的评分,包括:根据所述KN个特征组合中的语义特征的置信概率、语义特征的类型、语义特征的差别中的至少一种语义特征信息,对所述KN个特征组合分别进行所述图像集合中各图像相似目标之间的区别描述能力的评分。
可选地,在评分时依据多种语义特征信息的情形下,所述对所述KN个特征组合分别进行所述图像集合中各图像相似目标之间的区别描述能力的评分,还包括:将所述KN个特征组合中同一特征组合的所述多种语义特征信息分别对应的评分合并或加权合并,得到每个特征组合的评分结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710278676.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序