[发明专利]一种告警消息中截取音视频片段的方法及系统有效
申请号: | 202210501049.X | 申请日: | 2022-05-10 |
公开(公告)号: | CN114598918B | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 马骥;林巍;李幸福 | 申请(专利权)人: | 浪潮通信技术有限公司 |
主分类号: | H04N21/439 | 分类号: | H04N21/439;H04N21/44;H04N21/845 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 肖艳 |
地址: | 266107 山东省*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 告警 消息 截取 视频 片段 方法 系统 | ||
本发明提供一种告警消息中截取音视频片段的方法及系统,属于音视频编解码技术领域,包括:获取音视频实时流;将所述音视频实时流送入先进先出FIFO缓冲区,基于预先训练好的AI音视频告警识别模型识别告警事件;其中,所述AI音视频告警识别模型是基于音视频流告警样本数据,以及告警分类标签训练得到的;根据所述告警事件中的告警时刻,获取所述FIFO缓冲区中告警音视频片段。本发明通过人工智能告警识别模型,对音视频中较小颗粒维度的告警信息进行准确识别,并截取告警信息相关的音视频数据流,能完整还原告警事件,具有高效准确的特点。
技术领域
本发明涉及音视频编解码技术领域,尤其涉及一种告警消息中截取音视频片段的方法及系统。
背景技术
目前,随着人工智能以及相关音视频业务的普及,涉及大量对实时音视频流进行信息识别和特定消息获取的需求,特别是告警事件的识别。
通常从摄像头、音响等输入设备采集的实时音频和视频流需要更智能的检测与识别,并根据检测与识别结果触发相应的告警消息,场景服务应用已逐步推广开来。大多数方案采用从监控系统中持续记录的监控视频或者音频文件提取出告警时刻前后的数据,普遍存在查找告警时刻前后音视频片段难度大,以及准确率低的问题。
针对上述无法精确识别音视频流中告警消息对应的告警音视频流,需要提出新的告警消息中截取音视频片段的方法,能更精确地实现截取告警音视频流的效果。
发明内容
本发明提供一种告警消息中截取音视频片段的方法及系统,用以解决现有技术中从监控音视频文件中提取告警时刻对应的音视频流时存在不够准确的缺陷。
第一方面,本发明提供一种告警消息中截取音视频片段的方法,包括:
获取音视频实时流;
将所述音视频实时流送入FIFO缓冲区,基于预先训练好的AI音视频告警识别模型识别告警事件;其中,所述AI音视频告警识别模型是基于音视频流告警样本数据,以及告警分类标签训练得到的;
根据所述告警事件中的告警时刻,获取所述FIFO缓冲区中告警音视频片段。
根据本发明提供的一种告警消息中截取音视频片段的方法,所述获取音视频实时流,包括:
由音视频采集设备采集音视频流,对所述音视频流拉取实时数据流,得到所述音视频实时流。
根据本发明提供的一种告警消息中截取音视频片段的方法,所述将所述音视频实时流送入FIFO缓冲区,基于预先训练好的AI音视频告警识别模型识别告警事件之前,还包括:
确定所述告警事件的截取时长,以所述截取时长的中心点为所述告警时刻;
基于预设音视频编码方式、音视频参数和所述告警时刻,计算FIFO缓冲区大小。
根据本发明提供的一种告警消息中截取音视频片段的方法,所述将所述音视频实时流送入FIFO缓冲区,基于预先训练好的AI音视频告警识别模型识别告警事件,包括:
基于预设封装格式对所述音视频实时流进行封装,得到封装流数据;
将所述封装流数据输入至所述AI音视频告警识别模型,输出告警检测结果;
基于所述告警检测结果确定所述告警事件。
根据本发明提供的一种告警消息中截取音视频片段的方法,所述根据所述告警事件中的告警时刻,获取所述FIFO缓冲区中告警音视频片段,包括:
以所述告警时刻为中心点,按照截取时长从所述FIFO缓冲区中获取所述告警音视频片段。
根据本发明提供的一种告警消息中截取音视频片段的方法,所述根据所述告警事件中的告警时刻,获取所述FIFO缓冲区中告警音视频片段,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮通信技术有限公司,未经浪潮通信技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210501049.X/2.html,转载请声明来源钻瓜专利网。