[发明专利]一种面向视频流的深度学习目标识别方法及系统在审
申请号: | 202211243031.0 | 申请日: | 2022-10-11 |
公开(公告)号: | CN115690615A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 胡涛;姜峰;罗灵鲲;王伟长;张宏飞;魏春燕 | 申请(专利权)人: | 杭州视图智航科技有限公司 |
主分类号: | G06V20/17 | 分类号: | G06V20/17;G06V10/764;G06V20/40 |
代理公司: | 深圳市联江知识产权代理事务所(特殊普通合伙) 44939 | 代理人: | 旷江华 |
地址: | 310000 浙江省杭州市富*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 视频 深度 学习 目标 识别 方法 系统 | ||
1.一种面向视频流的深度学习目标识别方法,其特征在于,所述方法包括以下步骤:
获取待识别任务及其对应的视频流,解析所述待识别任务中的识别对象,并提取所述识别对象的对象属性,根据所述对象属性,仿真所述识别对象对应的模拟图像,并计算所述模拟图像与所述识别对象之间的置信度;
在所述置信度大于预设阈值时,对所述视频流进行图像分帧,得到分帧图像,结合所述模拟图像采用预设的背景分离算法去除所述分帧图像中的背景区域,以得到所述分帧图像中的前景区域图像和三元区域图像;
分别对所述前景区域图像和所述三元区域图像进行图像分类,得到前景图像类别和三元图像类别;
根据所述模拟图像和所述前景图像类别,对所述前景区域图像进行筛选处理,得到目标前景图像,及根据所述模拟图像和所述三元图像类别,对所述三元区域图像进行筛选处理,得到目标三元图像;
计算所述目标前景图像和所述模拟图像的第一关联度,及计算所述目标三元图像和所述模拟图像的第二关联度,并根据所述第一关联度和所述第二关联度,计算所述分帧图像和所述模拟图像的最终关联度;
根据所述最终关联度,从所述视频流中定位所述识别对象的位置序列,得到所述识别对象的识别结果。
2.如权利要求1所述的面向视频流的深度学习目标识别方法,其特征在于,所述解析所述待识别任务中的识别对象,包括:
获取所述待识别任务对应的文本信息;
提取所述文本信息的词语,得到词语文本;
计算所述词语文本在所述文本信息中的贡献度;
结合预设的条件和所述贡献度,对所述词语文本进行筛选,得到筛选词语;
对所述筛选词语进行语义分析,得到词语语义;
根据所述词语语义,得到所述待识别任务的识别对象。
3.如权利要求1所述的面向视频流的深度学习目标识别方法,其特征在于,所述计算所述模拟图像与所述识别对象之间的置信度,包括:
利用下述公式计算所述模拟图像与所述识别对象之间的置信度:
其中,Y表示模拟图像与识别对象之间的置信度,a表示模拟图像中的起始图像因素,x表示模拟图像中的终止图像因素,m!表示第m个图像因素对应的特征向量值,U表示识别对象,Um表示第m个识别对象对应的置信系数,y表示模拟图像在识别对象中的占比值。
4.如权利要求1所述的面向视频流的深度学习目标识别方法,其特征在于,所述对所述视频流进行图像分帧,得到分帧图像,包括:
获取所述视频流的视频序列,所述视频序列包括帧率和分辨率;
根据所述分辨率,对所述视频流进行画质优化,得到优化视频流;
对所述优化视频进行干扰去除,得到目标视频流;
根据所述帧率,对所述目标视频流进行分帧处理,得到分帧图像。
5.如权利要求1所述的面向视频流的深度学习目标识别方法,其特征在于,所述结合所述模拟图像采用预设的背景分离算法去除所述分帧图像中的背景区域,以得到所述分帧图像中的前景区域图像和三元区域图像,包括:
利用预设的电磁波频谱获取所述分帧图像对应的灰度图像;
提取所述灰度图像中每个像素点对应的像素值;
根据所述像素值,利用下述公式识别所述分帧图像中的背景区域:
其中,T(e|γ)表示分帧图像中的背景区域,i表示分帧图像的起始像素值,M表示分帧图像的终止像素值,Gi表示第i个像素值对应的混合权重值,Ui(e)表示第i个像素值的像素密度值;
利用所述预设的背景分离算法对所述背景区域进行去除,得到所述分帧图像的前景区域图像和三元区域图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州视图智航科技有限公司,未经杭州视图智航科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211243031.0/1.html,转载请声明来源钻瓜专利网。