[发明专利]基于AI检测或分类结果改变音频或视频压缩在审

申请号：	202011183711.9	申请日：	2020-10-29
公开（公告）号：	CN112788347A	公开（公告）日：	2021-05-11
发明（设计）人：	P·扎特卢卡尔	申请（专利权）人：	希侬人工智能公司
主分类号：	H04N19/70	分类号：	H04N19/70
代理公司：	北京市汉坤律师事务所 11602	代理人：	魏小薇;吴丽丽
地址：	美国华***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于 ai 检测分类结果改变音频视频压缩
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种方法，所述方法包括由一个或多个计算设备：

从一个或多个相机接收包括多个帧的视频流，其中所述视频流以第一质量被接收；

使用机器学习模型来分析所述帧中的图像，其中所述机器学习模型已被训练以检测所述图像中的一个或多个感兴趣对象；

识别包括所述视频流的第一多个连续帧的感兴趣序列，其中在所述连续帧中的至少一个帧中检测到至少一个感兴趣对象；并且

生成包括所述感兴趣序列的视频包。

2.根据权利要求1所述的方法，还包括：

响应于确定在所述感兴趣序列之后的所述帧中的最小数量的图像中未检测到所述一个或多个感兴趣对象，传输所述视频包。

3.根据权利要求1所述的方法，还包括：

响应于确定在所述感兴趣序列之后的所述帧中的最小数量的图像中未检测到所述一个或多个感兴趣对象，存储所述视频包。

4.根据权利要求1所述的方法，还包括：

在所述分析期间，响应于在所述图像中检测到所述一个或多个感兴趣对象，开始在缓冲器中与所述感兴趣序列对应的所述视频流的帧存储。

5.根据权利要求4所述的方法，还包括：

响应于确定在所述感兴趣序列之后的所述帧中的最小数量的图像中未检测到所述一个或多个感兴趣对象，结束所述缓冲器中的所述帧存储。

6.根据权利要求5所述的方法，其中所述视频包是在结束所述缓冲器中的所述帧存储之后生成的。

7.根据权利要求4所述的方法，其中所述视频包是响应于确定所述缓冲器已降至低于可用容量的最小阈值而生成的。

8.根据权利要求1所述的方法，还包括：

确定在包括在所述感兴趣序列之前或之后接收的所述视频流的第二多个连续帧的连续视频帧序列的图像中未检测到所述感兴趣对象；

响应于确定在所述连续视频帧序列的图像中未检测到所述感兴趣对象，将所述连续视频帧序列压缩至第二质量，其中所述压缩降低所述第二多个连续帧中的图像的分辨率；并且

生成包括所压缩的序列的单独视频包。

9.根据权利要求8所述的方法，其中包括所压缩的序列的所述单独视频包被包括在包括所述感兴趣序列的所述视频包中。

10.根据权利要求8所述的方法，还包括：

响应于确定所述一个或多个感兴趣对象不在所压缩的序列之后的所述帧中的阈值数量的图像中，传输所述单独视频包。

11.根据权利要求8所述的方法，还包括：

响应于确定所述一个或多个感兴趣对象不在所压缩的序列之后的所述帧中的阈值数量的图像中，存储所述单独视频包。

12.根据权利要求8所述的方法，还包括：

识别代表所压缩的序列的所压缩的序列的一帧；并且

用所述一帧替换所压缩的序列。

13.根据权利要求1所述的方法，还包括：

将所述图像中的所检测到的所述一个或多个感兴趣对象分类为多个类别中的一个类别，其中识别所述感兴趣序列基于检测所述多个类别中的特定类别的一个感兴趣对象。

14.根据权利要求13所述的方法，还包括：

基于所检测到的所述一个或多个感兴趣对象的类别来修改所述视频包的分辨率。

15.根据权利要求1所述的方法，还包括：

响应于在所述感兴趣序列的所述连续帧中的至少一个帧中检测到所述至少一个感兴趣对象，触发一个或多个其他计算设备从其相应的视频流生成附加视频包，其中每个所述附加视频包均包括第二多个连续帧，所述第二多个连续帧与所述第一多个连续帧的时间帧对应。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于希侬人工智能公司，未经希侬人工智能公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011183711.9/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载