[发明专利]一种基于多级感知自编码网络的视频人脸识别方法及系统在审

申请号：	202310410387.7	申请日：	2023-04-18
公开（公告）号：	CN116486457A	公开（公告）日：	2023-07-25
发明（设计）人：	高希占;刘星瑞;胡洧;牛四杰;王佳禾;尹飞;冯光;董吉文	申请（专利权）人：	济南大学
主分类号：	G06V40/16	分类号：	G06V40/16;G06V20/40;G06V10/774;G06V10/776;G06V10/82;G06N3/0455;G06N3/0464
代理公司：	山东高景专利代理事务所(特殊普通合伙) 37298	代理人：	高小荷
地址：	250000 山东***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于多级感知编码网络视频识别方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于多级感知自编码网络的视频人脸识别系统，其特征在于，所述系统包括：

视频数据采集模块：获取用于计算机识别与处理的视频数据；

数据预处理模块：对采集到的视频数据进行预处理，获得图像集数据，并把获取的图像集数据每类中所有样本平均分配，一半样本作为训练集，一半样本作为验证集；

模型构建模块：构建基于多级感知自编码网络的视频人脸识别方法模型，包括视频特征生成模块，距离度量学习模块；

模型训练模块：通过多种损失函数的联合优化，学习类内紧凑且具有判别力的视频深度概念级特征表示；

样本预测模块：根据已经训练好的网络，输入视频数据，自动生成该视频对应的深度特征表示，并将该特征与人脸库进行比对，以此来确认身份信息。

2.根据权利要求1所述的一种基于多级感知自编码网络的视频人脸识别系统，其特征在于，所述视频特征生成模块基于自编码器构建，该模块以数量可变的人脸视频或人脸图像集作为输入，生成该视频紧凑、鲁棒、维度固定的深度概念级特征表示，然后通过构建所述距离度量学习模块，对所述概念级特征进行嵌入学习，使得同类视频特征彼此凝聚，不同类视频特征彼此分离，进一步增强视频特征的判别能力。

3.基于权利要求1或2的一种基于多级感知自编码网络的视频人脸识别方法，其特征在于，所述方法的实现包括内容如下：

步骤1，获取可用于计算机识别与处理的视频帧序列，并对数据进行预处理操作，以获得图像集数据；

步骤2，对步骤1中所述图像集数据随机分成训练集与测试集，并将所述训练集中的数据再次随机平均分配为训练集与验证集用于训练；

步骤3，将步骤2中的所述训练集和验证集中的数据输入到多级感知自编码网络的视频特征生成模块中，生成每个图像集的深度概念级特征表示；

步骤4，将步骤3中所述图像集的深度概念级特征输入到距离度量学习模块中，进一步增强视频特征的判别能力；

步骤5，通过交叉熵损失函数、重建损失函数、中心损失函数和对比损失函数联合优化网络模型；

步骤6，利用训练好的所述网络模型生成每个图像集数据的最优特征表示，并基于欧式距离进行分类。

4.根据权利要求3所述的一种基于多级感知自编码网络的视频人脸识别方法，其特征在于，所述步骤1的实现步骤包括内容如下：

步骤1.1，输入采集到的视频序列数据，并将所述视频序列数据的视频帧看作图像集合；对图像集合中的图像进行目标检测，得到只包含目标区域的图像，并对目标区域进行对齐，经裁剪操作获取相同大小的目标图像。

5.根据权利要求3或4所述的一种基于多级感知自编码网络的视频人脸识别方法，其特征在于，所述步骤2的实现步骤包括内容如下：

步骤2.1，从所述步骤1获取的图像集数据的每个类中随机抽取若干个集合，用于构建训练集；

步骤2.2，把抽取的训练集中的每个图像集随机均分为新的训练集和验证集，分别做如下描述：