[发明专利]用于使用卷积神经网络标识数字视频中的人体行为的方法、系统和介质在审
申请号: | 202080098798.1 | 申请日: | 2020-10-19 |
公开(公告)号: | CN115427982A | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 华武·邓;穆罕默德·哈马德·穆萨扎德;瓦利德·穆罕默德·阿利·艾哈迈德 | 申请(专利权)人: | 华为云计算技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 550025 贵州省贵阳市*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 使用 卷积 神经网络 标识 数字视频 中的 人体 行为 方法 系统 介质 | ||
一种用于根据数字视频的帧序列对人体行为进行分类的方法、处理系统和处理器可读介质。2D卷积神经网络用于标识在每个帧内可见的人体上的关键点,例如人体关节。为每个视频帧创建所述关键点的编码表示。对应于所述帧序列的所述编码表示序列由3D CNN处理,所述3D CNN被训练为根据随时间变化的关键点位置标识人体行为。
相关申请的交叉引用
本申请要求于2020年4月6日提交的、发明名称为“使用卷积神经网络标识数字视频中的人体行为的方法、系统和介质(METHOD,SYSTEM,AND MEDIUM FOR IDENTIFYINGHUMAN BEHAVIOR IN A DIGITIAL VIDEO USING CONVOLUTIONAL NEURAL NETWORKS)”的美国专利申请序列号16/841,227的优先权,其内容通过引用的方式并入本文中。
技术领域
本发明涉及数字视频中的人体跟踪,具体涉及用于标识数字视频中人体行为的方法、系统和处理器可读介质。
背景技术
识别人体行为是计算机视觉研究中的一个长期的问题。虽然机器学习在计算机视觉领域取得了进步,包括在数字图像或数字视频中标识人体以及在数字视频的多帧上跟踪人体的移动的一系列方法,但在数字视频中标识或识别特定类型的人体行为仍然存在困难。
在计算机视觉中,机器学习已被应用于人体行为标识问题,但成功率低。目前的机器学习方法在从数字视频中识别和标识人体行为方面表现出远低于人类水平的准确性。例如,Facebook开发的一种系统根据数字视频中显示的人体行为标识被禁止的视频内容形式,该系统在2019年年初上了新闻头条,原因是它未能在上传到平台的视频中检测到新西兰大规模枪手的暴力行为(参见
文献中有各种机器学习方法,用于使用机器学习标识数字视频中的人体行为。这些机器学习方法中的一些方法使用卷积神经网络,这些卷积神经网络非常适合高效地处理二维和三维数字图像。这些机器学习方法中的一些方法使用递归神经网络,这些递归神经网络非常适合处理随着时间的推移而变化的数据,但通常是计算密集型的。图1A至图1D示出了几种这样的机器学习方法:
图1A示出了用于标识和分类数字视频中的人体行为的第一机器学习方法10。第一机器学习方法使用二维卷积神经网络(two-dimensional convolutional neuralnetwork,2D CNN)14来对数字视频的二维帧12序列执行空间处理并生成空间信息。与2DCNN 14并行,第一机器学习方法10使用光流模块16来处理数字视频的二维帧序列12,以从二维帧序列12导出光流数据。由光流模块16输出的光流数据16和由2D CNN 14输出的空间信息被组合,以建立在二维帧序列12中检测到的人的表观运动模式。将由光流模块16输出的光流数据和由2DCNN 14输出的空间信息组合,产生代表在二维帧序列12中检测到的人的表观运动模式的背景和人体信息18。背景和人体信息18被提供给人体行为分类器19,以标识与在二维帧12序列中检测到的人体行为相对应的一个类别(或分类)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为云计算技术有限公司,未经华为云计算技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080098798.1/2.html,转载请声明来源钻瓜专利网。