[发明专利]一种针对新闻场景的景别识别方法有效
申请号: | 202110799561.2 | 申请日: | 2021-07-15 |
公开(公告)号: | CN113255628B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 陆维琛;温序铭;李杰;党博 | 申请(专利权)人: | 成都索贝数码科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 贾年龙 |
地址: | 610041 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 新闻 场景 识别 方法 | ||
本发明公开了一种针对新闻场景的景别识别方法,包括步骤:S1,构建电视新闻场景的景别识别数据集、场景识别数据集和目标检测数据集;S2,选取场景识别训练网络和目标检测训练网络分别进行训练,得到训练后的场景识别模型和目标检测模型;S3,为目标检测数据集中每个类别增加一个反映其实际尺寸的先验信息;S4,对景别识别数据集中的图像进行编码,将景别识别数据集中的图像输入训练后的目标检测模型,得到图像中的景物信息,并将该景物信息编码为特征;S5,基于编码后的景别数据集训练支持向量机进行景别识别等。本发明有效地融合了图像中的目标和场景信息,适用于多种场景和主体目标,可有效地提升新闻视频的编辑效率,减少人工成本。
技术领域
本发明涉及电视新闻制作领域,更为具体的,涉及一种针对新闻场景的景别识别方法。
背景技术
随着网络技术的发展,数字视频的普及,融媒体的兴起,视频数据的处理和分析技术变得越来越重要。
景别是指由于被摄物体与摄像机距离不同,而造成被摄物体在画面中所呈现出的范围大小不同。虽然景别的划分没有一个严格的标准,但通常被划分为远景、全景、中景、近景、特写。
在电视新闻制作过程中,一般来说既要有新闻事件的全景画面,也要有新闻细节的近景或特写画面,还应考虑到后期剪辑的方便而包含不同景别的画面。
通过交替地使用各种不同的景别,可以使得对事件的叙述、人物思想感情的表达、人物关系的处理更具有表现力。
由于电视新闻制作过程中有大量的原始素材,若通过人工的方式来对景别进行判断需要很高的人力成本。
发明内容
本发明的目的在于克服现有技术的不足,提供一种针对新闻场景的景别识别方法,有效地融合了图像中的目标和场景信息,适用于多种场景和主体目标,可有效地提升新闻视频的编辑效率,减少人工成本等。
本发明的目的是通过以下方案实现的:
一种针对新闻场景的景别识别方法,包括步骤:
S1,构建电视新闻场景的景别识别数据集、场景识别数据集、目标检测数据集;
S2,选取场景识别训练网络和目标检测训练网络分别进行训练,得到训练后的场景识别模型和目标检测模型;
S3,为目标检测数据集中每个目标类别增加一个反映其实际尺寸的先验信息;
S4,对景别识别数据集中的图像进行编码,将景别识别数据集中的图像同时输入训练后的场景识别和目标检测模型,从而得到图像中的景物信息,并将该景物信息编码为特征;
S5,基于编码后的景别识别数据集训练支持向量机进行景别识别。
进一步地,在步骤S1中,构建电视新闻场景的景别识别数据集、场景识别、目标检测数据集包括步骤:S11,收集新闻视频并从中提取图片,构成图片集合;S12,对步骤S11中每张图片的景别类别和场景进行标注,从而构成景别识别数据集和场景识别数据集;其中,构建目标检测数据集包括步骤:S1a,在COCO数据集的基础上,加入Open Image v4中与人体相关的数据,构成目标检测数据集。
进一步地,在步骤S2中,在步骤S12构成的场景识别数据集上训练得到场景识别模型,在步骤S1a构成的目标检测数据集上训练得到目标检测模型。
进一步地,在步骤S3中,包括如下步骤:
S31,从目标检测数据集中,针对每个目标类别各选择多张图像作为代表样本;
S32,根据步骤S31选出的代表样本,为每个类别分配一个能够反映其实际大小尺寸的变量S作为先验信息。
进一步地,在步骤S4中,包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都索贝数码科技股份有限公司,未经成都索贝数码科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110799561.2/2.html,转载请声明来源钻瓜专利网。