[发明专利]训练装置、图像识别装置、训练方法和计算机可读信息存储介质有效
申请号: | 201780089794.5 | 申请日: | 2017-04-26 |
公开(公告)号: | CN110582783B | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 小野大地 | 申请(专利权)人: | 索尼互动娱乐股份有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/0464;G06N3/084 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张晓明 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 装置 图像 识别 方法 计算机 可读 信息 存储 介质 | ||
提供的是可以利用已经使用CG图像训练过的分类器来提高捕获图像的识别的准确度的学习设备、图像识别设备、学习方法和计算机可读信息存储介质。中间特征量识别单元(44)识别中间特征量。偏移特征量识别单元(46)基于CG中间特征量和捕获图像中间特征量来识别偏移特征量。偏移后中间特征量识别单元(48)基于与CG图像相关联的中间特征量和偏移特征量来识别与CG图像相关联的偏移后中间特征量。当使用与CG图像相关联的偏移后中间特征量对捕获图像进行识别时,第二分类器训练单元(50)训练接收与捕获图像相关联的中间特征量的第二分类器(40b)。
技术领域
本发明涉及训练装置、图像识别装置、训练方法和计算机可读信息存储介质。
背景技术
近年来,在机器学习领域中,使用分类器对摄影图像进行图像识别的技术受到了关注。
语义分割是使用分类器对摄影图像进行图像识别的技术之一。通过语义分割,为包括在输入摄影图像中的每个像素识别像素的含义,诸如由像素表示的对象。
此外,存在使用分类器对摄影图像进行图像识别的技术的其它示例。这些技术的示例包括用于识别输入的摄影图像是什么的技术和用于识别输入的摄影图像中放置了什么的技术。
发明内容
[技术问题]
为了提高使用诸如语义分割的分类器对摄影图像进行图像识别的精度,需要使用大量摄影图像对分类器进行训练。然而,获取大量的摄影图像是困难的。针对这种情况,一种可能的方法是使用由计算机图形技术创建的计算机图形(CG)图像而不是使用摄影图像来训练分类器。
然而,即使CG图像与摄影图像相似,CG图像与摄影图像之间的特征也存在差异。此外,由于特征中的差异,使用利用CG图像训练过的分类器来提高对摄影图像进行图像识别的精度是有限的。
本发明是针对上述问题而做出的。本发明的目的之一是提供能够使用已经利用CG图像训练过的分类器来提高对摄影图像进行图像识别的精度的训练装置、图像识别装置、训练方法和程序。
[问题的解决方案]
为了解决上述问题,根据本发明的训练装置包括:中间特征识别部分,其被配置为在图像的输入数据被输入到第一分类器的情况下,将来自包括在第一分类器的中间层中的输出识别为与图像相关联的中间特征,第一分类器被配置为对CG图像和摄影图像进行分类;偏移特征识别部分,其被配置为基于以下来识别偏移特征:与一个CG图像相关联的中间特征、或每一个都与多个CG图像的对应一个相关联的多个中间特征;以及与一个摄影图像相关联的中间特征、或每一个都与多个摄影图像的对应一个相关联的多个中间特征;偏移后中间特征识别部分,其被配置为基于与CG图像相关联的中间特征和偏移特征识别与CG图像相关联的偏移后中间特征;以及训练部分,其被配置为使用每一个都与多个CG图像的对应一个相关联的多个偏移后中间特征来执行第二分类器的训练,第二分类器被配置为在对摄影图像执行图像识别的情况下接收与摄影图像相关联的中间特征。
在本发明的一个方面,偏移特征识别部分被配置为基于每一个都与多个CG图像的对应一个相关联的多个中间特征的代表值、以及每一个都与多个摄影图像的对应一个相关联的多个中间特征的代表值来识别偏移特征。
此外,在本发明的一个方面,第一分类器包括已经使用CG图像的训练数据和摄影图像的训练数据训练过的分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼互动娱乐股份有限公司,未经索尼互动娱乐股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780089794.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序