[发明专利]图像识别方法、装置及终端在审
申请号: | 201510701222.0 | 申请日: | 2015-10-26 |
公开(公告)号: | CN105335712A | 公开(公告)日: | 2016-02-17 |
发明(设计)人: | 张涛;汪平仄;张胜凯 | 申请(专利权)人: | 小米科技有限责任公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 终端 | ||
1.一种图像识别方法,其特征在于,所述方法包括:
获取待识别的第一类光源图像与第二类光源图像;
将所述第一类光源图像与所述第二类光源图像分别输入训练后的卷积神经网络模型,确定所述第一类光源图像的第一特征与所述第二类光源图像的第二特征;
将与所述第一特征和所述第二特征对应的类别参数输入训练后的分类模型,识别出图像类别,所述图像类别用于表示所述第一类光源图像所含对象与所述第二类光源图像所含对象是否一致。
2.根据权利要求1所述的方法,其特征在于,所述获取待识别的第一类光源图像与第二类光源图像,包括:
接收所述第一类光源图像与所述第二类光源图像;
分别将所述第一类光源图像与所述第二类光源图像归一化到预设的像素尺寸。
3.根据权利要求1所述的方法,其特征在于,所述训练后的卷积神经网络模型包括一个输入层、五个卷积层、三个池化层和两个全连接层;五个卷积层之前为输入层,三个池化层分别位于第一、第二、第五个卷积层之后,两个全连接层位于第三个池化层之后。
4.根据权利要求1所述的方法,其特征在于,在将所述第一类光源图像与所述第二类光源图像分别输入训练后的卷积神经网络模型,确定所述第一类光源图像的第一特征与所述第二类光源图像的第二特征之前,还包括:
从训练样本集中选取第一类别的预设组数的第一类训练数据,选取的第一类训练数据包括预设对象的第一类光源图像与第二类光源图像;
根据选取的第一类训练数据执行如下迭代过程:
将选取的每组第一类训练数据所包括的图像分别输入预设的卷积神经网络模型,确定每组第一类训练数据的第一特征和第二特征,并将每组第一类训练数据的第一特征和第二特征对应的第一类差值参数分别输入所述预设的卷积神经网络模型对应的卷积神经网络自带的分类器进行训练;
当所述卷积神经网络自带的分类器能根据输入的第一类差值参数完成与所述第一类别相应的分类时,确定所述预设的卷积神经网络模型为训练后的卷积神经网络模型;
当所述卷积神经网络自带的分类器不能根据输入的第一类差值参数完成与所述第一类别相应的分类时,更新所述预设的卷积神经网络模型的模型参数,并返回执行所述迭代过程。
5.根据权利要求4所述的方法,其特征在于,当所述卷积神经网络自带的分类器能根据输入的第一类差值参数完成与所述第一类别相应的分类时,确定所述预设的卷积神经网络模型为训练后的卷积神经网络模型,包括:
从所述训练样本集中选取第二类别的预设组数的第二类训练数据,选取的第二类训练数据包括第一预设对象的第一类光源图像与第二预设对象的第二类光源图像;
将选取的每组第二类训练数据所包括的图像分别输入预设的卷积神经网络模型,确定每组第二类训练数据的第一特征和第二特征;
将每组第二类训练数据的第一特征和第二特征对应的第二类差值参数分别输入所述预设的卷积神经网络模型对应的卷积神经网络自带的分类器进行训练;
当所述卷积神经网络自带的分类器能分别根据输入的第一类差值参数和第二类差值参数完成与所述第一类别和所述第二类别相应的分类时,确定所述预设的卷积神经网络模型为训练后的卷积神经网络模型。
6.根据权利要求1所述的方法,其特征在于,所述将与所述第一特征和所述第二特征对应的类别参数输入训练后的分类模型,识别出图像类别,包括:
获取所述第一特征与所述第二特征的差值的绝对值作为所述类别参数;
将所述类别参数输入训练后的分类模型,识别出所述图像类别。
7.根据权利要求1所述的方法,其特征在于,所述分类模型为支持向量机或softmax分类器。
8.根据权利要求7所述的方法,其特征在于,在将与所述第一特征和所述第二特征对应的类别参数输入训练后的分类模型,识别出图像类别之前,还包括:
将训练所述卷积神经网络模型所得的第一特征和第二特征的差值的绝对值作为输入参数,输入所述支持向量机或所述softmax分类器;
基于所述输入参数对所述支持向量机或所述softmax分类器进行训练;
当所述支持向量机或所述softmax分类器能根据所述输入参数成功完成分类时,确定所述支持向量机或所述softmax分类器为所述分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于小米科技有限责任公司,未经小米科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510701222.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序