[发明专利]一种基于机器学习的视频内容识别方法及装置在审
申请号: | 201810174048.2 | 申请日: | 2018-03-02 |
公开(公告)号: | CN108334861A | 公开(公告)日: | 2018-07-27 |
发明(设计)人: | 陈长伟;杨晓亮;田丹 | 申请(专利权)人: | 北京未来媒体科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100142 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频帧 视频内容识别 基于机器 视频内容 互联网视频 视频资源 机器学习模型 方案应用 内容识别 有效识别 学习 解析 场景 | ||
1.一种基于机器学习的视频内容识别方法,其特征在于,包括:
将待识别的视频资源解析为多个视频帧;
通过经过训练的深度机器学习模型对所述多个视频帧进行内容识别处理,分别确认每个视频帧所包含的视频内容;
根据所述每个视频帧所包含的视频内容,确定所述视频资源所包含的视频内容。
2.根据权利要求1所述的方法,其特征在于,所述根据所述每个视频帧所包含的视频内容,确定所述视频资源所包含的视频内容,包括:
汇总所述每个视频帧所包含的视频内容得到所述视频资源所包含的视频内容,以及分别确认每项视频内容在所述视频资源中的时间位置。
3.根据权利要求1或2所述的方法,其特征在于,对所述深度机器学习模型的训练过程,包括:
循环执行以下操作,直到计算得到的代价值小于设定阈值;
将已标注图像内容的图像输入深度机器学习模型,使所述深度机器学习模型按照预设的参数对所述图像进行图像内容识别;
将所述深度机器学习模型识别的图像内容,与标注的图像内容进行对比,得到所述深度机器学习模型进行图像内容识别的代价值;
判断得到的代价值是否小于设定阈值;
如果得到的代价值不小于设定阈值,则根据计算得到的代价值,调整所述深度机器学习模型进行图像内容识别的参数。
4.根据权利要求3所述的方法,其特征在于,对所述深度机器学习模型的训练过程还包括:
建立包含不同类型图像内容,并且已经标注图像内容的图像资源数据库。
5.根据权利要求3所述的方法,其特征在于,所述深度机器学习模型包括卷积神经网络。
6.一种基于机器学习的视频内容识别装置,其特征在于,包括:
视频解析单元,用于将待识别的视频资源解析为多个视频帧;
视频帧识别单元,用于通过经过训练的深度机器学习模型对所述多个视频帧进行内容识别处理,分别确认每个视频帧所包含的视频内容;
视频内容确定单元,用于根据所述每个视频帧所包含的视频内容,确定所述视频资源所包含的视频内容。
7.根据权利要求6所述的装置,其特征在于,所述视频内容确定单元根据所述每个视频帧所包含的视频内容,确定所述视频资源所包含的视频内容时,具体用于:
汇总所述每个视频帧所包含的视频内容得到所述视频资源所包含的视频内容,以及分别确认每项视频内容在所述视频资源中的时间位置。
8.根据权利要求6或7所述的装置,其特征在于,所述视频帧识别单元还用于对所述深度机器学习模型进行训练;
所述视频帧识别单元对所述深度机器学习模型进行训练时,具体用于:
循环执行以下操作,直到计算得到的代价值小于设定阈值;
将已标注图像内容的图像输入深度机器学习模型,使所述深度机器学习模型按照预设的参数对所述图像进行图像内容识别;
将所述深度机器学习模型识别的图像内容,与标注的图像内容进行对比,得到所述深度机器学习模型进行图像内容识别的代价值;
判断得到的代价值是否小于设定阈值;
如果得到的代价值不小于设定阈值,则根据计算得到的代价值,调整所述深度机器学习模型进行图像内容识别的参数。
9.根据权利要求8所述的装置,其特征在于,所述视频帧识别单元还用于:
建立包含不同类型图像内容,并且已经标注图像内容的图像资源数据库。
10.根据权利要求8所述的装置,其特征在于,所述深度机器学习模型包括卷积神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京未来媒体科技股份有限公司,未经北京未来媒体科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810174048.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:细胞图像的处理方法和装置
- 下一篇:一种虹膜识别系统及其虹膜识别方法