[发明专利]图像识别装置、图像识别方法和程序在审
申请号: | 201780093077.X | 申请日: | 2017-07-18 |
公开(公告)号: | CN110914830A | 公开(公告)日: | 2020-03-24 |
发明(设计)人: | 堀川勉;小野大地 | 申请(专利权)人: | 索尼互动娱乐股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张晓明 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 装置 方法 程序 | ||
提供了能够以高精度识别多种对象的图像识别装置、图像识别方法和程序。整体识别单元(58)对至少一个给定对象执行识别对象在图像中的位置的处理。部分图像提取单元(60)从图像中提取部分图像,该部分图像是与所识别的位置相关联的图像的一部分。部分识别单元(64)执行识别由部分图像表示的一个或多个对象是什么的处理,所述一个或多个对象包括其位置被识别的给定对象以外的对象。
技术领域
本发明涉及图像识别装置、图像识别方法和程序。
背景技术
已知一种图像识别技术,其基于在将要识别的图像输入到学习模型时获得的输出来识别由图像表示的对象或图像中表示的对象的位置。例如,对于包含在输入图像中的每个像素,像素的含义(诸如由像素表示的对象)由称为语义分割的技术来指定。
发明内容
[技术问题]
当意图由图像识别有差别地识别多种对象时,由于与对象相关联的各个特征量之间的差异变小,错误识别的可能性增加。
本发明是针对上述问题做出的,并且其目的之一是提供能够以高精度识别多种物体的图像识别装置、图像识别方法和程序。
[问题的解决方案]
为了解决上述问题,根据本发明的图像识别装置包括:第一识别单元,其对至少一个给定对象执行识别给定对象在图像中的位置的处理;部分图像提取单元,其从图像提取部分图像,部分图像是与识别的位置相关联的图像的一部分;以及第二识别单元,其执行识别由部分图像表示的一个或多个对象是什么的处理,一个或多个对象包括其所述位置被识别的给定对象以外的对象。
本发明的一个方面还包括:模型选择单元,其从多个学习模型中选择对应于其所述位置被识别的给定对象的学习模型,其中,第二识别单元通过使用选择的学习模型来执行识别由部分图像表示的对象是什么的处理。
此外,在本发明的一个方面,部分图像提取单元提取占据基于与对象对应的规则、通过将图像中表示其位置被识别的给定对象的区域移动或变形而获得的区域的部分图像.
在这方面,部分图像提取占据单元提取通过将图像中表示其位置被识别的给定对象的区域在与对象对应的方向上移动而获得的区域的部分图像。
可选地,部分图像提取单元提取占据通过将图像中表示其位置被识别的给定对象的区域放大或减小到与对象对应的尺寸而获得的区域的部分图像。
此外,根据本发明的图像识别方法包括:对至少一个给定对象执行识别给定对象在图像中的位置的处理的步骤;从图像提取部分图像的步骤,部分图像是与识别的位置相关联的图像的一部分;以及执行识别由部分图像表示的一个或多个对象是什么的处理的步骤,一个或多个对象包括其所述位置被识别的给定对象以外的对象。
此外,根据本发明的程序使计算机执行:对至少一个给定对象执行识别给定对象在图像中的位置的处理的程序;从图像提取部分图像的程序,部分图像是与识别的位置相关联的图像的一部分;以及执行识别由部分图像表示的一个或多个对象是什么的处理的程序,一个或多个对象包括其所述位置被识别的给定对象以外的对象。
附图说明
图1是根据本发明实施例的图像识别装置的配置图。
图2是示出拍摄图像的一个示例的图。
图3是示出深度图像的一个示例的图。
图4是示出整体识别结果图像的一个示例的图。
图5是示出部分识别管理数据的一个示例的图。
图6是示出部分拍摄图像的一个示例的图。
图7是示出部分深度图像的一个示例的图。
图8是示出部分识别结果图像的一个示例的图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼互动娱乐股份有限公司,未经索尼互动娱乐股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780093077.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序