[发明专利]一种图像内容识别方法及装置有效
申请号: | 201510753125.6 | 申请日: | 2015-11-06 |
公开(公告)号: | CN105354307B | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 李向林 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/58 | 分类号: | G06F16/58;G06F16/55;G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 内容 识别 方法 装置 | ||
本发明公开了一种图像内容识别方法以装置,包括:提取待识别图像的CNN特征;将所述待识别图像输入到预建的图像分类器集合中,并根据所述待识别图像的CNN特征获取所述图像分类器集合中每个图像分类器输出的概率值根据所述每个图像分类器输出的概率值,从所述图像分类器集合中选取至少一个图像分类器作为目标图像分类器;确定所述目标图像分类器中的每张图像与所述待识别图像的相似度,并根据所述相似度从所述目标图像分类器中选取多张图像作为目标图像;使用所述目标图像分类器中的类簇对应的类型标签以及所述目标图像分类器中的所述目标图像对应的实体标签,对所述待识别图像进行标注。采用本发明实施例,可以提高图像识别的精确性。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种图像内容识别方法及装置。
背景技术
随着互联网技术以及社交媒体的的发展,用户需要处理的图片越来越多,互联网与社交网络软件上存在大量用户上传的图片,这些图片大多数没有标注内容信息,例如:地理位置图片,知名的景点或者建筑图片等,导致用户无法确定这些图片是什么内容的图片或哪个地方的图片,因此需要一种识别这些图片的方法。
在现有技术方案中,首先抽取待识别图片的特征,然后在图像数据库中检索与待识别图片的特征最相似的若干特征数据,最后利用相似数据的相关网页文本来推断待是被图片的内容标签。但是,这种方法存在以下缺点:第一:依赖与待识别图片相关的网页文本数据,然而从文本数据中提取的内容标签包含有较多的噪声;第二:检索的图像数据库规模庞大,包含了较多的噪声,容易检索到内容相似但语义不同的图片,造成最终给出的标签不够准确;第三:识别出来的图片内容的范围较大,不够精确。
发明内容
本发明实施例提供一种图像内容识别方法及装置。通过两次相似度匹配计算对待识别图像进行标注,提高了图像识别的精确性。
本发明第一方面提供了一种图像内容识别方法,包括:
提取待识别图像的CNN特征;
将所述待识别图像输入到预建的图像分类器集合中,并根据所述待识别图像的CNN特征获取所述图像分类器集合中每个图像分类器输出的概率值,所述每个图像分类器包括一个类簇,所述类簇对应类型标签,所述每个类簇包括多个图像,所述多个图像中的每张图像对应实体标签;
根据所述每个图像分类器输出的概率值,从所述图像分类器集合中选取至少一个图像分类器作为目标图像分类器;
确定所述目标图像分类器中的每张图像与所述待识别图像的相似度,并根据所述相似度从所述目标图像分类器中选取多张图像作为目标图像;
使用所述目标图像分类器中的类簇对应的类型标签以及所述目标图像分类器中的所述目标图像对应的实体标签,对所述待识别图像进行标注。
在第一方面的第一种可能的实现方式中,所述每个图像分类器对应一个系数向量,所述根据所述待识别图像的CNN特征获取所述图像分类器集合中每个图像分类器输出的概率值包括:
将所述待识别图像的CNN特征转化为所述待识别图像的特征向量;
根据所述每个图像分类器的系数向量与所述待识别图像的特征向量,计算所述每个图像分类器与所述待识别图像的向量内积;
根据所述每个图像分类器与所述待识别图像的向量内积,计算所述每个图像分类器输出的概率值。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述根据所述每个图像分类器与所述待识别图像的向量内积,计算所述每个图像分类器输出的概率值包括:
将所述每个图像分类器与所述待识别图像的向量内积映射到正实数域得到指数值,并计算指数值之和;
将所述目标图像分类器与所述待识别图像的指数值除以所述指数值之和,计算得到所述目标图像分类器输出的概率值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510753125.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:立体磁场演示仪
- 下一篇:核电站全范围模拟机机房布置系统
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法