[发明专利]一种基于头肩检测的跟踪录播方法及系统在审

申请号：	201910210983.4	申请日：	2019-03-20
公开（公告）号：	CN110021034A	公开（公告）日：	2019-07-16
发明（设计）人：	吴玉香;王玉;郭泽辉	申请（专利权）人：	华南理工大学
主分类号：	G06T7/246	分类号：	G06T7/246;H04N5/76
代理公司：	广州市华学知识产权代理有限公司 44245	代理人：	李斌
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	跟踪检测摄像机待跟踪目标网络模型自动调整镜头待检测图像跟踪目标静止状态目标运动实时采集预设位置姿态变化自动跟踪鲁棒性图像帧缩放预设遮挡转换保证学习图片
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于头肩检测的跟踪录播方法，其特征在于，所述跟踪录播方法包括下列步骤：

S1、预先对头肩图片进行深度学习，生成已训练的头肩检测网络模型；

S2、将实时采集的待检测视频帧采用已训练的头肩检测网络模型进行计算，判断待检测视频帧序列中是否检测到待跟踪目标对象；

S3、当没有检测到待跟踪目标对象时，摄像机保持预设静止状态；当检测到待跟踪目标对象时，确定待跟踪目标对象并切换摄像机的状态为跟踪录播状态。

2.根据权利要求1所述的一种基于头肩检测的跟踪录播方法，其特征在于，所述步骤S1包括：

S11、制作包含训练集和验证集的图片数据库：采集人体目标运动视频并对视频帧中的头肩区域进行标注，标注区域为正样本，未标注区域为负样本，组成训练集和验证集；

S12、构建用于深度学习的头肩检测网络模型：以TensorFlow深度学习框架为基础，在SSD目标检测模型上获取头肩检测网络模型，其中，所述头肩检测网络模型的结构如下：

从输入层到输出层依次连接为：VGG-16网络部分、卷积层conv6、卷积层conv7、卷积层conv8_2、卷积层conv9_2、卷积层conv10_2、卷积层conv11_2，其中，VGG-16网络部分包括卷积层conv1_1、卷积层conv1_2、卷积层conv2_1、卷积层conv2_2、卷积层conv3_1、卷积层conv3_2、卷积层conv4_1、卷积层conv4_2、卷积层conv4_3、卷积层conv5_1、卷积层conv5_2、卷积层conv5_3，对卷积层conv4_3、卷积层conv7、卷积层conv8、卷积层conv9_2、卷积层conv10_2、卷积层conv11_2的输出分别采用两个3*3大小的卷积核进行卷积并将结果合并，获取8732个默认框default box；采用非极大值抑制算法选取置信度最高的区域作为预测结果；

S13、采用头肩检测网络模型对图片数据库进行训练学习，生成已训练的头肩检测网络模型。

3.根据权利要求1所述的一种基于头肩检测的跟踪录播方法，其特征在于，所述头肩检测网络模型进行训练的目标损失函数定义为：

其中x＝{0,1}是指示变量，表示默认包围框与真实包围框对目标类型是否匹配，c表示对每一类的置信度，l表示预测框，g表示真实框，L_conf表示置信度损失，L_loc为定位损失，α用于平衡定位损失和置信度损失，N表示匹配的默认框的数目。

4.根据权利要求2所述的一种基于头肩检测的跟踪录播方法，其特征在于，所述步骤S13包括：

S131、对头肩检测网络模型进行深度学习参数的配置及初始化：使用标准差σ的高斯分布初始化参数，设置学习率和最大迭代次数，进行动量设置；

S132、对训练集中的头肩图片采用随机梯度下降法及反向传播算法进行批量学习，并监测学习图片的数量是否超过预设的图片数量阈值，当超过时，得到初步训练的头肩检测网络模型，进行下一步；

S133、使用验证集中的头肩图片对初步训练的头肩检测网络模型进行准确率计算，判断准确率是否超过预设的准确率阈值，当准确率没有超过预设准确率阈值时，返回步骤S132继续训练学习；

S134、当准确率超过预设的准确率阈值时，生成已训练的头肩检测网络模型。

5.根据权利要求1所述的一种基于头肩检测的跟踪录播方法，其特征在于，所述步骤S2包括：

S21、加载已训练的头肩检测网络模型，并读取实时采集的待检测视频帧，然后对待检测的视频帧进行预处理，其中，预处理包括图像去噪以及归一化；

S22、将预处理后的待检测视频帧采用已训练的头肩检测网络模型进行计算，判断待检测视频帧序列中是否检测到待跟踪目标对象。

6.根据权利要求5所述的一种基于头肩检测的跟踪录播方法，其特征在于，所述判断是否检测到待跟踪目标对象的过程如下：