[发明专利]一种用于图像标识识别的方法、设备及计算机可读存储介质有效
申请号: | 201810231999.9 | 申请日: | 2018-03-20 |
公开(公告)号: | CN110309833B | 公开(公告)日: | 2021-03-05 |
发明(设计)人: | 邓向冬;崔俊生;覃毅力 | 申请(专利权)人: | 国家新闻出版广电总局广播电视规划院 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62 |
代理公司: | 北京知元同创知识产权代理事务所(普通合伙) 11535 | 代理人: | 张祖萍 |
地址: | 100866 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 图像 标识 识别 方法 设备 计算机 可读 存储 介质 | ||
本发明实施例涉及一种用于图像标识识别的方法、设备及计算机可读存储介质。该方法包括:获取包含图像标识的待识别图像;基于特征点匹配算法,得到待识别图像包含的图像标识与多个目标图像标识的匹配结果,所述匹配结果指示所述图像标识所匹配的目标图像标识;以及如果匹配结果指示的所匹配的目标图像标识属于识别正确组,将所匹配的目标图像标识确定为待识别图像包含的图像标识所对应的目标图像标识;并且如果匹配结果指示的所匹配的目标图像标识属于深度识别组,利用深度模型来确定待识别图像包含的图像标识所对应的目标图像标识。本发明实施例提出的技术方案利用自适应特征点匹配与机器学习图像识别,提高了图像标识识别的准确性。
技术领域
本发明总体上属于图像数据处理领域,具体涉及一种用于图像标识识别的方法、设备及计算机可读存储介质。
背景技术
目前,图像标识广泛应用于视频和图片中,如在视频中的电视台的频道标识、视频中广告中商标、图片中商标、视频图片中机构标识等。目前存在海量的数字视频和图片,同时,数字视频和图片生成越来越容易,电视网络和数据网络正在快速生成大量的数字视频和图片。
在实际应用中,识别视频、图片中的图像标识的应用需求随之越来越多。例如收视数据的收集,通过对正在播放视频中电视台频道标识的识别,可以收集电视观众的收视数据。或者对于网页浏览,通过对网络浏览中商业标识的采集识别,可以收集用户的浏览信息或偏好信息。所期望的是,能够提供一种更准确识别图像标识的技术方案。
发明内容
针对上述问题,本发明的实施例提供一种用于图像标识识别的方法、设备及计算机可读存储介质,利用自适应特征点匹配与机器学习图像识别,提高了图像标识识别的准确性。
在本发明的第一方面,提供一种用于图像标识识别的方法。该方法包括:获取包含图像标识的待识别图像;基于特征点匹配算法,得到待识别图像包含的图像标识与多个目标图像标识的匹配结果,所述匹配结果指示所述图像标识所匹配的目标图像标识;以及响应于匹配结果指示的所匹配的目标图像标识属于识别正确组,将所匹配的目标图像标识确定为待识别图像包含的图像标识所对应的目标图像标识;并且响应于匹配结果指示的所匹配的目标图像标识属于深度识别组,利用深度模型来确定待识别图像包含的图像标识所对应的目标图像标识;识别正确组包含被认为正确识别的目标图像标识,并且深度识别组包含被认为待深度训练的目标图像标识。
在某些实施例中,该方法还包括:基于特征点匹配算法,对多个识别学习图像集针对多个目标图像标识进行识别,以得到每个目标图像标识的识别结果,每个识别学习图像集中的识别学习图像包含同一目标图像标识,识别结果指示识别正确程度;根据识别结果,将每个目标图像标识选择性地关联到识别正确组和深度识别组之一;以及基于深度学习算法,针对深度识别组中的目标图像标识生成深度模型。
在某些实施例中,将每个目标图像标识选择性地关联到识别正确组和深度识别组之一包括:响应于识别结果指示的识别正确程度大于第一阈值,将相应的目标图像标识关联到识别正确组;以及响应于识别结果指示的识别正确程度小于或等于第一阈值,将相应的目标图像标识关联到深度识别组。
在某些实施例中,每个目标图像标识的识别结果还指示识别出的特征点数量和识别出的图像标识,所述深度识别组包括识别混淆组和无法识别组,将每个目标图像标识选择性地关联到识别正确组和深度识别组之一包括:响应于识别结果指示的特征点数量大于第二阈值且识别出的图像标识包括不同于相应的识别学习图像集所包含同一目标图像标识的其他目标图像标识,将深度识别组中的该目标图像标识与其他目标图像标识关联到识别混淆组;以及响应于识别结果指示的特征点数量小于或等于第二阈值,将深度识别组中的目标图像标识关联到无法识别组。
在某些实施例中,针对深度识别组中的目标图像标识生成深度模型包括:针对识别混淆组中的目标图像标识,基于深度学习算法对包含识别混淆组内的目标图像标识的训练图像集进行训练,以生成第一深度模型;以及。针对无法识别组中的目标图像标识,基于深度学习算法对包含无法识别组内的目标图像标识的训练图像集进行训练,以生成第二深度模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家新闻出版广电总局广播电视规划院,未经国家新闻出版广电总局广播电视规划院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810231999.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序