[发明专利]一种针对新闻场景的景别识别方法有效
申请号: | 202110799561.2 | 申请日: | 2021-07-15 |
公开(公告)号: | CN113255628B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 陆维琛;温序铭;李杰;党博 | 申请(专利权)人: | 成都索贝数码科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 贾年龙 |
地址: | 610041 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 新闻 场景 识别 方法 | ||
1.一种针对新闻场景的景别识别方法,其特征在于,包括步骤:
S1,构建电视新闻场景的景别识别数据集、场景识别数据集、目标检测数据集;
S2,选取场景识别训练网络和目标检测训练网络分别进行训练,得到训练后的场景识别模型和目标检测模型;
S3,为目标检测数据集中每个目标类别增加一个反映其实际尺寸的先验信息;
在步骤S3中,包括如下步骤:
S31,从目标检测数据集中,针对每个目标类别各选择多张图像作为代表样本;
S32,根据步骤S31选出的代表样本,为每个类别分配一个能够反映其实际大小尺寸的变量S作为先验信息;
S4,对景别识别数据集中的图像进行编码,将景别识别数据集中的图像同时输入训练后的场景识别和目标检测模型,从而得到图像中的景物信息,并将该景物信息编码为特征;
在步骤S4中,包括如下步骤:
S41,使用目标检测模型对景别识别数据集中选出的每个样本进行目标检测,记录检测结果中最大检测框的宽和高分别占图像幅面宽和高的比例和:
;
;
其中,和分别为最大检测框的宽和高,和分别为图像幅面的宽和高;
S42,根据景别识别数据集中每个样本中最大检测框的类别,将该类别所对应的步骤S32中所述的变量S记录下来,此时,,共同作为对应图像的目标编码信息:
;
S43,使用场景识别模型对景别识别数据集中的每个样本进行场景识别,将每个样本对应的场景类别记录下来,作为场景编码信息;
S44,将步骤S42中的目标编码信息和步骤S43中的场景编码信息拼接起来作为用于景别识别的特征:
;
S5,基于编码后的景别识别数据集训练支持向量机进行景别识别。
2.根据权利要求1所述的一种针对新闻场景的景别识别方法,其特征在于,在步骤S1中,构建电视新闻场景的景别识别数据集、场景识别、目标检测数据集包括步骤:S11,收集新闻视频并从中提取图片,构成图片集合;S12,对步骤S11中每张图片的景别类别和场景进行标注,从而构成景别识别数据集和场景识别数据集;其中,构建目标检测数据集包括步骤:S1a,在COCO数据集的基础上,加入OpenImagev4中与人体相关的数据,构成目标检测数据集。
3.根据权利要求2所述的一种针对新闻场景的景别识别方法,其特征在于,在步骤S2中,在步骤S12构成的场景识别数据集上训练得到场景识别模型,在步骤S1a构成的目标检测数据集上训练得到目标检测模型。
4.根据权利要求1所述的一种针对新闻场景的景别识别方法,其特征在于,在步骤S5中,包括如下子步骤:
S51,将经过目标编码和场景编码后的样本集合作为最终的景别识别数据集;
S52,将步骤S51中的景别识别数据集按照设定比例划分为训练集和测试集;
S53,在步骤S52划分的训练集上进行10折交叉验证法确定最优超参数;
S54,使用步骤S53中确定的最优超参数训练支持向量机,训练得到最终的支持向量机模型进行景别识别。
5.根据权利要求4所述的一种针对新闻场景的景别识别方法,其特征在于,在步骤S32中,所述变量S:
其中,分别代表极大、大、中、中小、小、极小。
6.根据权利要求1所述的一种针对新闻场景的景别识别方法,其特征在于,在步骤S52中,设定比例为5:1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都索贝数码科技股份有限公司,未经成都索贝数码科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110799561.2/1.html,转载请声明来源钻瓜专利网。