[发明专利]一种基于多级感知自编码网络的视频人脸识别方法及系统在审
申请号: | 202310410387.7 | 申请日: | 2023-04-18 |
公开(公告)号: | CN116486457A | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 高希占;刘星瑞;胡洧;牛四杰;王佳禾;尹飞;冯光;董吉文 | 申请(专利权)人: | 济南大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V20/40;G06V10/774;G06V10/776;G06V10/82;G06N3/0455;G06N3/0464 |
代理公司: | 山东高景专利代理事务所(特殊普通合伙) 37298 | 代理人: | 高小荷 |
地址: | 250000 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多级 感知 编码 网络 视频 识别 方法 系统 | ||
1.一种基于多级感知自编码网络的视频人脸识别系统,其特征在于,所述系统包括:
视频数据采集模块:获取用于计算机识别与处理的视频数据;
数据预处理模块:对采集到的视频数据进行预处理,获得图像集数据,并把获取的图像集数据每类中所有样本平均分配,一半样本作为训练集,一半样本作为验证集;
模型构建模块:构建基于多级感知自编码网络的视频人脸识别方法模型,包括视频特征生成模块,距离度量学习模块;
模型训练模块:通过多种损失函数的联合优化,学习类内紧凑且具有判别力的视频深度概念级特征表示;
样本预测模块:根据已经训练好的网络,输入视频数据,自动生成该视频对应的深度特征表示,并将该特征与人脸库进行比对,以此来确认身份信息。
2.根据权利要求1所述的一种基于多级感知自编码网络的视频人脸识别系统,其特征在于,所述视频特征生成模块基于自编码器构建,该模块以数量可变的人脸视频或人脸图像集作为输入,生成该视频紧凑、鲁棒、维度固定的深度概念级特征表示,然后通过构建所述距离度量学习模块,对所述概念级特征进行嵌入学习,使得同类视频特征彼此凝聚,不同类视频特征彼此分离,进一步增强视频特征的判别能力。
3.基于权利要求1或2的一种基于多级感知自编码网络的视频人脸识别方法,其特征在于,所述方法的实现包括内容如下:
步骤1,获取可用于计算机识别与处理的视频帧序列,并对数据进行预处理操作,以获得图像集数据;
步骤2,对步骤1中所述图像集数据随机分成训练集与测试集,并将所述训练集中的数据再次随机平均分配为训练集与验证集用于训练;
步骤3,将步骤2中的所述训练集和验证集中的数据输入到多级感知自编码网络的视频特征生成模块中,生成每个图像集的深度概念级特征表示;
步骤4,将步骤3中所述图像集的深度概念级特征输入到距离度量学习模块中,进一步增强视频特征的判别能力;
步骤5,通过交叉熵损失函数、重建损失函数、中心损失函数和对比损失函数联合优化网络模型;
步骤6,利用训练好的所述网络模型生成每个图像集数据的最优特征表示,并基于欧式距离进行分类。
4.根据权利要求3所述的一种基于多级感知自编码网络的视频人脸识别方法,其特征在于,所述步骤1的实现步骤包括内容如下:
步骤1.1,输入采集到的视频序列数据,并将所述视频序列数据的视频帧看作图像集合;对图像集合中的图像进行目标检测,得到只包含目标区域的图像,并对目标区域进行对齐,经裁剪操作获取相同大小的目标图像。
5.根据权利要求3或4所述的一种基于多级感知自编码网络的视频人脸识别方法,其特征在于,所述步骤2的实现步骤包括内容如下:
步骤2.1,从所述步骤1获取的图像集数据的每个类中随机抽取若干个集合,用于构建训练集;
步骤2.2,把抽取的训练集中的每个图像集随机均分为新的训练集和验证集,分别做如下描述:
对于训练集,用表示,其中Xi是具有Ki幅图像的图像集或人脸视频序列,即其中是图像集Xi中的第k张图片,yi是Xi对应的类别标签,n表示图像集的数量;
对于验证集,用表示,包括n个不同的图像集,其中y′i是X′i对应的标签;
步骤2.3,将所有类中剩余的图像集合,构成测试集,用于检验模型的性能;记录其中每个图像集合的类标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南大学,未经济南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310410387.7/1.html,转载请声明来源钻瓜专利网。