[发明专利]一种基于头肩检测的跟踪录播方法及系统在审
申请号: | 201910210983.4 | 申请日: | 2019-03-20 |
公开(公告)号: | CN110021034A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 吴玉香;王玉;郭泽辉 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;H04N5/76 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 跟踪 检测 摄像机 待跟踪目标 网络模型 自动调整镜头 待检测图像 跟踪目标 静止状态 目标运动 实时采集 预设位置 姿态变化 自动跟踪 鲁棒性 图像帧 缩放 预设 遮挡 转换 保证 学习 图片 | ||
1.一种基于头肩检测的跟踪录播方法,其特征在于,所述跟踪录播方法包括下列步骤:
S1、预先对头肩图片进行深度学习,生成已训练的头肩检测网络模型;
S2、将实时采集的待检测视频帧采用已训练的头肩检测网络模型进行计算,判断待检测视频帧序列中是否检测到待跟踪目标对象;
S3、当没有检测到待跟踪目标对象时,摄像机保持预设静止状态;当检测到待跟踪目标对象时,确定待跟踪目标对象并切换摄像机的状态为跟踪录播状态。
2.根据权利要求1所述的一种基于头肩检测的跟踪录播方法,其特征在于,所述步骤S1包括:
S11、制作包含训练集和验证集的图片数据库:采集人体目标运动视频并对视频帧中的头肩区域进行标注,标注区域为正样本,未标注区域为负样本,组成训练集和验证集;
S12、构建用于深度学习的头肩检测网络模型:以TensorFlow深度学习框架为基础,在SSD目标检测模型上获取头肩检测网络模型,其中,所述头肩检测网络模型的结构如下:
从输入层到输出层依次连接为:VGG-16网络部分、卷积层conv6、卷积层conv7、卷积层conv8_2、卷积层conv9_2、卷积层conv10_2、卷积层conv11_2,其中,VGG-16网络部分包括卷积层conv1_1、卷积层conv1_2、卷积层conv2_1、卷积层conv2_2、卷积层conv3_1、卷积层conv3_2、卷积层conv4_1、卷积层conv4_2、卷积层conv4_3、卷积层conv5_1、卷积层conv5_2、卷积层conv5_3,对卷积层conv4_3、卷积层conv7、卷积层conv8、卷积层conv9_2、卷积层conv10_2、卷积层conv11_2的输出分别采用两个3*3大小的卷积核进行卷积并将结果合并,获取8732个默认框default box;采用非极大值抑制算法选取置信度最高的区域作为预测结果;
S13、采用头肩检测网络模型对图片数据库进行训练学习,生成已训练的头肩检测网络模型。
3.根据权利要求1所述的一种基于头肩检测的跟踪录播方法,其特征在于,所述头肩检测网络模型进行训练的目标损失函数定义为:
其中x={0,1}是指示变量,表示默认包围框与真实包围框对目标类型是否匹配,c表示对每一类的置信度,l表示预测框,g表示真实框,Lconf表示置信度损失,Lloc为定位损失,α用于平衡定位损失和置信度损失,N表示匹配的默认框的数目。
4.根据权利要求2所述的一种基于头肩检测的跟踪录播方法,其特征在于,所述步骤S13包括:
S131、对头肩检测网络模型进行深度学习参数的配置及初始化:使用标准差σ的高斯分布初始化参数,设置学习率和最大迭代次数,进行动量设置;
S132、对训练集中的头肩图片采用随机梯度下降法及反向传播算法进行批量学习,并监测学习图片的数量是否超过预设的图片数量阈值,当超过时,得到初步训练的头肩检测网络模型,进行下一步;
S133、使用验证集中的头肩图片对初步训练的头肩检测网络模型进行准确率计算,判断准确率是否超过预设的准确率阈值,当准确率没有超过预设准确率阈值时,返回步骤S132继续训练学习;
S134、当准确率超过预设的准确率阈值时,生成已训练的头肩检测网络模型。
5.根据权利要求1所述的一种基于头肩检测的跟踪录播方法,其特征在于,所述步骤S2包括:
S21、加载已训练的头肩检测网络模型,并读取实时采集的待检测视频帧,然后对待检测的视频帧进行预处理,其中,预处理包括图像去噪以及归一化;
S22、将预处理后的待检测视频帧采用已训练的头肩检测网络模型进行计算,判断待检测视频帧序列中是否检测到待跟踪目标对象。
6.根据权利要求5所述的一种基于头肩检测的跟踪录播方法,其特征在于,所述判断是否检测到待跟踪目标对象的过程如下:
获取摄像机在预设静止状态下拍摄得到的视频帧序列;
当所述视频帧序列中连续且超过预设帧数的视频帧中出现待跟踪的目标对象时,确定检测到待跟踪目标对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910210983.4/1.html,转载请声明来源钻瓜专利网。