[发明专利]基于深度学习的动物视频标签自动生成方法、终端及介质在审
申请号: | 202010382574.5 | 申请日: | 2020-05-08 |
公开(公告)号: | CN111552837A | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 刘露;蔺昊 | 申请(专利权)人: | 深圳市英威诺科技有限公司 |
主分类号: | G06F16/78 | 分类号: | G06F16/78;G06F16/732;G06F16/783;G06K9/62 |
代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 占丽君 |
地址: | 518000 广东省深圳市南山区高新南四*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 动物 视频 标签 自动 生成 方法 终端 介质 | ||
1.一种基于深度学习的动物视频标签自动生成方法,其特征在于,包括以下步骤:
抽取待检测视频中若干个关键帧图像,将所述关键帧图像输入到特征提取模型中;
将特征提取模型输出的特征信息输入到训练好的目标检测算法模型中;
记录目标检测算法模型输出的目标物体在待检测视频中的位置和类别,定义目标物体的类别为待检测视频的动物标签。
2.根据权利要求1所述基于深度学习的动物视频标签自动生成方法,其特征在于,
所述特征提取模型由卷积神经网络构成,并通过ImageNet分类数据集训练得到。
3.根据权利要求1所述基于深度学习的动物视频标签自动生成方法,其特征在于,所述目标检测算法模型通过以下方法训练得到:
获取由多张训练图片构成的训练集,标注每张训练图片中物体的位置和类别;
基于TensorFlow框架编程实现目标检测算法;
利用所述训练集对所述目标检测算法进行训练;
保存训练好的目标检测算法为所述目标检测算法模型。
4.根据权利要求3所述基于深度学习的动物视频标签自动生成方法,其特征在于,
所述目标检测算法模型包括Faster RCNN算法模型。
5.根据权利要求4所述基于深度学习的动物视频标签自动生成方法,其特征在于,所述抽取待检测视频中若干个关键帧图像,将所述关键帧图像输入到特征提取模型中具体包括:
以预设的时间间隔抽取待检测视频中若干个帧图像,利用感知哈希算法对抽取到的帧图像进行去重处理,以获得所述关键帧图像;
将所述关键帧图像输入到特征提取模型中。
6.根据权利要求3所述基于深度学习的动物视频标签自动生成方法,其特征在于,
所述目标检测算法模型包括YOLOv2算法模型。
7.根据权利要求6所述基于深度学习的动物视频标签自动生成方法,其特征在于,所述抽取待检测视频中若干个关键帧图像,将所述关键帧图像输入到特征提取模型中具体包括:
按预设的时间间隔从待检测视频中抽取一帧图像;
利用感知哈希算法对新的帧图像与缓存的关键帧图像进行对比;如果对比结果小于预设的差异阈值时,丢弃新的帧图像;如果对比结果大于等于所述差异阈值时,定义新的帧图像为所述关键帧图像,将该关键帧图像输入到特征提取模型中;
缓存该关键帧图像。
8.根据权利要求5或7所述基于深度学习的动物视频标签自动生成方法,其特征在于,所述记录目标检测算法模型输出的目标物体在待检测视频中的位置和类别,定义目标物体的类别为待检测视频的动物标签具体包括:
记录Faster RCNN算法模型或YOLOv2算法模型输出的每个关键帧图像中目标物体的位置和类别;
统计所有关键帧图像中每类动物出现的次数,按照降序排列方式对每类动物在待检测视频中出现的次数进行排序,以获得所述待检测视频的动物标签。
9.一种终端,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市英威诺科技有限公司,未经深圳市英威诺科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010382574.5/1.html,转载请声明来源钻瓜专利网。