[发明专利]一种视频语义提取方法及装置有效
申请号: | 202011101561.2 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112307908B | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 伍永豪;刘念;李聪;伍绍儒 | 申请(专利权)人: | 武汉科技大学城市学院 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/774;G06K9/62 |
代理公司: | 武汉智嘉联合知识产权代理事务所(普通合伙) 42231 | 代理人: | 丁倩 |
地址: | 430000 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 语义 提取 方法 装置 | ||
本发明涉及视频语义分析技术领域,公开了一种视频语义提取方法,包括以下步骤:获取目标场景的样本视频,对所述样本视频中背景特征进行标注;通过标注后的样本视频对神经网络进行训练得到背景抽取模型;通过所述背景抽取模型抽取出目标视频中的背景特征,得到目标特征;建立多种目标物体的特征模型,并为每一种特征模型定义相对应的特征语义,得到特征语义库;在所述特征语义库中搜索与所述目标特征相匹配的目标特征模型,以所述目标特征模型所对应的特征语义作为所述目标视频的语义。本发明具有视频语义分析精度高、算法简单的技术效果。
技术领域
本发明涉及视频语义分析技术领域,具体涉及一种视频语义提取方法及装置。
背景技术
随着数字影像技术和互联网技术的迅速发展,互联网中的图像、视频越来越多。如何对图像、视频进行快速的识别,以便筛选出相关的目标图像、视频,是需要解决的问题。
目前,图像语义标注一般基于全局信息进行,这种方法由于掺杂了背景信息,因此精度不高,只适用于背景单一的图像。对于背景复杂的图像通常需要基于区域划分进行语义标注,然而区域划分无疑会增加语义标注的算法复杂度,降低标注效率,特别是对于视频语义标注来说,这种问题显得更为突出。
发明内容
本发明的目的在于克服上述技术不足,提供一种视频语义提取方法及装置,解决现有技术中视频语义标注精度低、算法复杂的技术问题。
为达到上述技术目的,本发明的技术方案提供一种视频语义提取方法,包括以下步骤:
获取目标场景的样本视频,对所述样本视频中背景特征进行标注;
通过标注后的样本视频对神经网络进行训练得到背景抽取模型;
通过所述背景抽取模型抽取出目标视频中的背景特征,得到目标特征;
建立多种目标物体的特征模型,并为每一种特征模型定义相对应的特征语义,得到特征语义库;
在所述特征语义库中搜索与所述目标特征相匹配的目标特征模型,以所述目标特征模型所对应的特征语义作为所述目标视频的语义。
本发明还提供一种视频语义提取装置,包括处理器以及存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现所述视频语义提取方法。
本发明还提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序被所述处理器执行时,实现所述视频语义提取方法。
与现有技术相比,本发明的有益效果包括:本发明对样本视频进行背景标注,以标注后的样本视频作为样本数据对神经网络进行训练,得到背景抽取模型,通过背景抽取模型可以快速抽取目标视频中背景特征,得到目标特征,在抽取得到目标特征后,将目标特征与特征语义库中特征模型进行对比匹配,得到相应的特征语义,各目标特征的特征语义组成目标视频的语义。由于摒除了背景特征对视频语义提取的影响,从而提高了语义提取的精度,且直接采用背景抽取模型抽取背景,简化了背景划分算法。
附图说明
图1是本发明提供的视频语义提取方法一实施方式的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明的实施例1提供了视频语义提取方法,包括以下步骤:
S1、获取目标场景的样本视频,对所述样本视频中背景特征进行标注;
S2、通过标注后的样本视频对神经网络进行训练得到背景抽取模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉科技大学城市学院,未经武汉科技大学城市学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011101561.2/2.html,转载请声明来源钻瓜专利网。