[发明专利]一种基于深度学习的步态分割与步态识别一体化方法有效
申请号: | 201610087973.2 | 申请日: | 2016-02-17 |
公开(公告)号: | CN105760835B | 公开(公告)日: | 2018-03-06 |
发明(设计)人: | 黄永祯;谭铁牛;王亮;宋纯锋 | 申请(专利权)人: | 银河水滴科技(北京)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/02 |
代理公司: | 天津市三利专利商标代理有限公司12107 | 代理人: | 韩新城 |
地址: | 101599 北京市密云区经济开发区兴盛南路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 步态 分割 识别 一体化 方法 | ||
1.一种基于深度学习的步态分割与步态识别一体化方法,其特征在于,所述方法包括:
将人形分割数据库中用于人形分割训练的图像以及对应的人形分割标注图像归一化到相同像素大小,得到用于分割训练的图像与人形分割标注图像的成对样本;
每次将N对所述图像及对应的人形分割标注图像送入一个N通道全卷积神经网络,得到与人形分割标注尺寸相同的N个表示人形轮廓分割预测结果的图像表达一;采用反向传播算法和随机梯度下降法减小该图像表达一与对应的人形分割标注图像比较得到的预测误差以训练该N通道全卷积神经网络,经过多次迭代训练得到用于步态分割的N通道分割卷积神经网络模型,并将该N通道分割卷积神经网络模型复制保存,作为一个固定的分割标注生成器;
每次从选定的每段步态视频中随机选取N张步态图像,送入所述N通道分割卷积神经网络模型得到N张表示人形轮廓预测分割结果的图像表达二,每段步态视频对应一个身份序号用于识别;
将得到的所述N张图像表达二作为输入,并以所述选定每段步态视频的身份序号作为输出,采用反向传播算法和随机梯度下降法减小预测步态身份与实际步态身份间的误差来迭代训练用于步态识别的分类卷积神经网络模型直到模型停止收敛;
将训练好的所述N通道分割卷积神经网络模型的输出端和分类卷积神经网络模型的输入端连接,组成一个输出为步态身份预测结果的步态分割与步态识别的一体化模型;
每次从选定的每段步态视频中随机选取N张步态图像送入所述N通道分割卷积神经网络模型得到对应人形轮廓预测分割图像的生成标注信息;同时利用该N张步态图像为输入,对应的人形轮廓预测分割图像和身份序号为监督信息,采用反向传播算法和随机梯度下降法联合训练所述步态分割与步态识别的一体化模型直到该一体化模型收敛停止;
测试时,随机选取一段步态视频中N张图像送入训练好的所述步态分割与步态识别的一体化模型,在所述步态分割与步态识别的一体化模型的soft-max分类器得到最大响应所在的节点序号,作为身份序号的预测结果。
2.根据权利要求1所述基于深度学习的步态分割与步态识别一体化方法,其特征在于,所述N通道全卷积神经网络模型的每一通道均包括有配置相同的多层卷积层与连接所述多层卷积层的最后一层的一层反卷积层。
3.根据权利要求1所述基于深度学习的步态分割与步态识别一体化方法,其特征在于,所述分类卷积神经网络模型包括多层卷积层以及连接最后一层卷积层的至少一层全连接层,所述全连接层的最后一层连接输出层----soft-max分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银河水滴科技(北京)有限公司,未经银河水滴科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610087973.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:图片类型的识别方法及装置
- 下一篇:成像板、图像采集器及终端