[发明专利]跳舞视频的识别方法及装置在审
申请号: | 201810813438.X | 申请日: | 2018-07-23 |
公开(公告)号: | CN109034049A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 陈竑;刘志勇;王鸣辉;王洋;杨鑫勇 | 申请(专利权)人: | 北京密境和风科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/08;G06F17/30;H04N21/2187;H04N21/44 |
代理公司: | 北京智汇东方知识产权代理事务所(普通合伙) 11391 | 代理人: | 康正德;盛惠华 |
地址: | 100016 北京市朝阳区酒仙桥*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 跳舞 直播 预处理 网络模型 截取 图片 预设时间间隔 结果确定 视频识别 速度要求 图片输入 服务器 耗时 部署 帮助 | ||
1.一种跳舞视频的识别方法,包括:
获取直播平台上在线的直播视频;
按照预设时间间隔从获取到的直播视频中截取多张图片,对截取到的多张图片进行预处理;
将预处理后的多张图片输入至预先部署在服务器上的网络模型,由所述网络模型识别预处理后的多张图片,得到图片的识别结果;其中,所述网络模型基于携带有跳舞或非跳舞标识的图片迭代训练得到;
根据图片的识别结果确定所述直播视频为跳舞视频或未跳舞视频。
2.根据权利要求1所述的方法,其中,获取直播平台上在线的直播视频,包括:
通过预置接口获取直播平台上在线的跳舞频道的直播信息;
根据直播信息获取对应的在线的直播视频,其中,所述直播信息为直播视频的唯一标识。
3.根据权利要求2所述的方法,其中,所述直播信息的内容包括以下任意一项:视频房间号、主播id、直播视频对应的url。
4.根据权利要求1-3任一项所述的方法,其中,对截取到的多张图片进行预处理,包括:
对截取到的多张图片的大小、像素、颜色中至少一项进行调整,以使调整后的图片符合所述网络模型的识别标准;和/或
将截取到的多张图片的格式转换成符合所述网络模型识别标准的指定格式的图片。
5.根据权利要求1-3任一项所述的方法,其中,将预处理后的多张图片输入至预先部署在服务器上的网络模型之前,还包括:
构建所述网络模型;
利用携带有跳舞或非跳舞标识的图片迭代训练构建的网络模型;
将迭代训练后的网络模型导出为预设格式的网络模型,将预设格式的网络模型部署在服务器上。
6.根据权利要求5所述的方法,其中,构建所述网络模型,包括:
设置网络模型的参数,所述参数包含批尺寸Batch_Size、图片的长宽,通道channl数量中的至少之一。
利用设置的网络模型的参数且基于网络inception-resnet和alexnet构建网络模型。
7.根据权利要求5所述的方法,其中,利用携带有跳舞或非跳舞标识的图片迭代训练构建的网络模型,包括:
从预置视频数据库中提取携带跳舞或非跳舞标识的视频,基于视频提取多张图片,所述图片携带跳舞或非跳舞标识;
对提取的多张图片进行预处理,利用预处理后的多张图片对构建的网络模型进行迭代训练,直到所述网络模型符合预设网络模型指标。
8.一种跳舞视频的识别装置,包括:
获取模块,适于获取直播平台上在线的直播视频;
图片截取及预处理模块,适于按照预设时间间隔从获取到的直播视频中截取多张图片,对截取到的多张图片进行预处理;
识别模块,适于将预处理后的多张图片输入至预先部署在服务器上的网络模型,由所述网络模型识别预处理后的多张图片,得到图片的识别结果;其中,所述网络模型基于携带有跳舞或非跳舞标识的图片迭代训练得到;
确定模块,适于根据图片的识别结果确定所述直播视频为跳舞视频或未跳舞视频。
9.一种计算机存储介质,所述计算机存储介质存储有计算机程序代码,当所述计算机程序代码在计算设备上运行时,导致所述计算设备执行权利要求1-7所述的跳舞视频的识别方法。
10.一种计算设备,包括:处理器;存储有计算机程序代码的存储器;当所述计算机程序代码被所述处理器运行时,导致所述计算设备执行权利要求1-7所述的跳舞视频的识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京密境和风科技有限公司,未经北京密境和风科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810813438.X/1.html,转载请声明来源钻瓜专利网。