[发明专利]一种基于深度学习的行为识别技术方法在审
申请号: | 201910413528.4 | 申请日: | 2019-05-17 |
公开(公告)号: | CN110188637A | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 来兴雪;陈颖 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 郑州芝麻知识产权代理事务所(普通合伙) 41173 | 代理人: | 董晓勇 |
地址: | 710000 陕西省西安市雁*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 双流 行为识别 卷积神经网络 神经网络模型 注意力机制 时空特征 视频 视频监控系统 时空 空间域特征 海量信息 记忆信息 时间序列 视觉神经 损失函数 分类器 时间域 识别率 智能化 准确率 人脑 算法 网络 融合 学习 引入 | ||
本发明公开了一种基于深度学习的行为识别技术方法,克服了现有技术中视频监控系统智能化有待提高的问题。该发明含有以下步骤,采用双流卷积神经网络和GRU网络相结合的方式搭建更深层次的时空双流CNN‑GRU神经网络模型;提取视频的时间域和空间域特征;根据GRU网络能记忆信息的能力,提取时空特征序列的长时间序列化特征,利用softmax分类器进行视频的行为识别;提出新的基于相关熵的损失函数;借鉴人脑视觉神经注意力机制处理海量信息的方法,在时空双流CNN‑GRU神经网络模型进行时空特征融合之前引入注意力机制。该技术提出的模型的准确率为61.5%,与基于双流卷积神经网络的算法相比,识别率有一定的提升。
技术领域
本发明涉及计算机视频识别技术,特别是涉及一种基于深度学习的行为识别技术方法。
背景技术
网络技术的发展和多媒体技术的突飞猛进,各种视频类媒介已经在人们的生活中随处可见,视频已经成为现代社会中常用的传送信息方式,并且视频类业务的增长趋势还在迅猛提高。随着数码相机、智能手机等视频设备的广泛使用,人们开始流行发送小视频作为相互传递信息的方式,从而代替传统的文字和图片。视频的产生成本越来越低,网络的传播又很广泛,每天都会产生大量的视频信息,网上已经产生了巨大的视频库。庞大的数据资源为我们的生活带来了很大的便利,同时拍摄及制作视频的方法日趋简单,视频内容良莠不齐并且可以无限制的在网络上传播,如果对那些不健康以及那些缺乏真实性、客观性的视频管理不完善,就会形成网络垃圾。这些视频垃圾破坏了良好的互联网环境,严重影响了广大网民尤其是青少年的身心健康,影响了和谐、健康发展的社会环境。因此,为了让人们在良好的互联网环境中享受高科技带来的便利,加强和改善网络中的视频管理是非常必要的。
视频监控系统普遍应用在商场、办公区域等公共场合,对社会公共安全有不可磨灭的作用,并且随着社会的发展,视频监控的需求在持续增长。现有的监控系统只是通过摄像头对特定地方进行拍摄并保存视频数据,监控功能主要依赖工作人员人工监控实现,工作人员必须长时间盯着多个屏幕从而实现对多个地方的实时监控,长时间的监控多个屏幕使工作人员很容易疲劳,不能及时发现和处理视频中的异常行为,有可能对人们的人身财产造成不可挽回得损失。再者,传统的监控系统日以继夜的产生监控数据,工作人员们也得日以继夜地实时观察监控屏幕,长时间监控庞大的视频数据对工作人员的身体健康也是巨大的挑战。因此,研究基于视频内容识别的算法有巨大的应用价值。试想,设计一个基于视频内容的行为识别监控系统,能够自动实时地监控视频内容。当视频中出现异常行为时,系统会自动进行行为识别并且发出预警通知工作人员。很大程度上将工作人员从庞大的数据处理中解放出来,工作人员不必夜以继日地时时刻刻盯着屏幕,而是让系统代替工作人员去监控,工作人员只需等待预警。基于视频内容的行为识别监控系统一方面可以减少在视频监控方面的人力投资,一方面有效的提高了视频监管的质量。
视频行为识别技术的主要内容是利用计算机快速处理问题的能力,使计算机代替人脑去识别视频中的人类行为,将人们从枯燥繁重的人工识别工作中解放出来,提高人们的工作效率,并且基于深度学习的视频行为识别技术还能解决人工无法解决的大数据类问题。视频行为识别技术的研究具有广阔的应用价值并且能更好的服务于社会。视频比图片、文本包含更多的信息,视频的时间连续性能表达事件的完整性和时序性,在娱乐活动中,用视频代替图片作为信息传递的媒介,能让人们更有效地享受视频带来的视觉上的冲击。监控工作人员可以实时地处理监控异常数据,警察调查案件时回放视频进行取证时,不用人工观察视频,而是系统自动地去检索,提高办案效率。视频的行为识别技术还可以应用在很多自动驾驶、无人商店、人机交互等前沿领域中,更加方便和改善人们的生活。
近年来,随着深度学习技术研究的深入,基于深度学习的视频行为识别技术也得到突飞猛进的发展,行为识别技术成为国内外研究者们的热点研究方向。Moeslund[1]将人的行为分为三层次,第一层次为微笑、点头等简单地基本动作,第二层次为走路、跳高等需要四肢相互协调的动作。第三个层次是人体和外界交互的动作,需要借助外部条件完成的动作,比如打网球、吃饭等动作。这三个层次是行为识别技术研究的主要依据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910413528.4/2.html,转载请声明来源钻瓜专利网。