[发明专利]视频分割网络模型的训练方法、视频分割方法及相关设备在审
申请号: | 202010626881.3 | 申请日: | 2020-07-01 |
公开(公告)号: | CN111815638A | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 崔婵婕;任宇鹏;卢维 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | G06T7/10 | 分类号: | G06T7/10 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 黎坚怡 |
地址: | 310051 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 分割 网络 模型 训练 方法 相关 设备 | ||
1.一种视频分割网络模型的训练方法,其特征在于,视频分割网络模型包括多个特征提取模块以及多个递归神经模块,所述特征提取模块和所述递归神经模块一一对应的,所述方法包括:
利用单帧训练图像对特征提取模块进行训练;
利用连续帧训练图像集对递归神经模块进行训练;其中,当前帧的递归神经模块的输入包括前一帧递归神经模块的输出以及当前帧的特征提取模块的输出。
2.根据权利要求1所述的训练方法,其特征在于,所述特征提取模块和所述递归神经模块的输出为相同大小的特征层。
3.根据权利要求1所述的训练方法,其特征在于,所述特征提取模块为残差网络,所述残差网络中最后两个下采样层为空洞卷积层。
4.根据权利要求3所述的训练方法,其特征在于,所述残差网络中最后两个下采样层分别为膨胀系数为2和4的空洞卷积层。
5.根据权利要求1所述的训练方法,其特征在于,所述多个特征提取模块的网络参数相同,所述多个递归神经模块的时序单元参数相同。
6.根据权利要求1所述的训练方法,其特征在于,所述视频分割网络模型包括多个输出模块,所述输出模块与所述递归神经模块一一对应;
所述输出模块包括卷积层,以及所述卷积层之后的BatchNorm激活层和Relu激活层。
7.根据权利要求6所述的训练方法,其特征在于,所述递归神经模块的卷积层为2048通道,所述输出模块的卷积层为512通道;所述输出模块的卷积层包括3×3的卷积核和1×1的卷积核。
8.一种视频分割方法,其特征在于,所述方法包括:
获取待分割的视频数据;
将所述待分割的视频数据输入到视频分割网络模型,获得所述视频数据的分割结果;
其中,所述视频分割网络模型为权利要求1-7中任一项所述的方法所训练的视频分割网络模型。
9.根据权利要求8所述的视频分割方法,其特征在于,所述待分割的视频数据包括多帧待分割图像;所述将所述待分割的视频数据输入到视频分割网络模型,获得所述视频数据的分割结果,包括:
将每一帧待分割图像输入到一特征提取模块,得到特征图像;其中,多个特征提取模块同步提取输入的待分割图像;
将每一特征提取模块输出的特征图像输入到对应的一递归神经模块,以输出每一帧待分割图像的分割结果;其中递归神经模块的输入还包括前一递归神经模块输出的分割结果。
10.一种终端设备,其特征在于,所述设备包括存储器以及与所述存储器耦接的处理器;
其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现如权利要求1~7任一项所述的视频分割网络模型的训练方法和/或权利要求8-9所述的视频分割方法。
11.一种计算机存储介质,其特征在于,所述计算机存储介质用于存储程序数据,所述程序数据在被处理器执行时,用以实现如权利要求1~7任一项所述的视频分割网络模型的训练方法和/或权利要求8-9所述的视频分割方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010626881.3/1.html,转载请声明来源钻瓜专利网。