[发明专利]一种基于统计的视频主持人识别方法有效
申请号: | 201610030286.7 | 申请日: | 2016-01-18 |
公开(公告)号: | CN105718871B | 公开(公告)日: | 2017-11-28 |
发明(设计)人: | 谢超平;吴春中;陈晓军 | 申请(专利权)人: | 成都索贝数码科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 成都金英专利代理事务所(普通合伙)51218 | 代理人: | 袁英 |
地址: | 610041 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于统计的视频主持人识别方法,对视频图像进行解码、分组和灰度处理,定位出每个灰度图像中的人脸位置和该人脸人物所穿衣服的衣服位置;通过直方图特征对每组图像的人脸位置区域图像进行相关性分析,计算相邻两组图像的人脸位置区域图像的相关度,将相似的两组图像连接形成片段;从每个片段中选取关键帧;根据关键帧的特征,对所有选取出来的关键帧进行相似度分析;将相似的关键帧归为一类,得到多个类别的关键帧,并统计每个类别中关键帧的数目;根据视频主持人的特征,将符合视频主持人的特征的类别,判定为存在视频主持人的关键帧,并确定出视频主持人在该类别的关键帧中的位置。本发明便于对新闻视频进行拆条处理。 | ||
搜索关键词: | 一种 基于 统计 视频 主持人 识别 方法 | ||
【主权项】:
一种基于统计的视频主持人识别方法,其特征在于,所述方法包括以下步骤:S1,视频预处理:S101,以帧为单位对视频图像进行解码处理,输出视频帧数据;S102,对视频帧数据进行分组处理,每m帧为一组得到多组三通道图像;S103,通过RGB三通道将每组三通道图像均转化为单通道灰度图像;S2,人脸识别处理:对每组三通道图像的灰度图像进行人脸识别,定位出每个灰度图像中的人脸位置;S3,衣服识别处理:根据人脸位置对人物的衣服进行识别,定位出该人脸人物所穿衣服的衣服位置;S4,相关性分析:S401,通过直方图特征对每组三通道图像的人脸位置区域图像进行相关性分析,对相邻两组三通道图像的人脸位置区域图像提取直方图,并进行均衡化处理;S402,计算该相邻两组三通道图像的人脸位置区域图像的相关度,判断该两组三通道图像是否相似,并将相似的两组三通道图像连接形成片段;S5,选取关键帧:S501:在每个片段中随机选取一个或多个帧作为关键帧;S502,根据关键帧的特征,对所有选取出来的关键帧进行相似度分析;S503,将相似的关键帧归为一类,得到多个类别的关键帧,并统计每个类别中关键帧的数目;S6,定位视频主持人:根据视频主持人的特征,将符合视频主持人的特征的类别,判定为存在视频主持人的关键帧,并确定出视频主持人在该类别的关键帧中的位置;所述S502中的相似度分析至少包括Hog特征相似分析、Hash指纹相似分析、直方图特征相似分析、多尺度LBP特征相似分析和衣服相似分析中的一种或多种组合;所述Hash指纹相似分析为:对每个关键帧进行分区,计算每个区域的均值,将每个区域的均值与该关键帧的均值作比较,根据比较结果再将每个区域二值化,得到该关键帧的Hash指纹,根据两个关键帧的对应区域的Hash指纹计算出该两个关键帧的相似度;所述直方图特征相似分析为:对每帧关键帧进行分区,计算每个区域的直方图特征,利用相关度算法计算每个区域的相似度,根据两个关键帧的对应区域的相似度投票决定两个关键帧是否相似;所述多尺度LBP特征相似分析为:利用每个像素点周围的8个像素计算出每个关键帧中每个像素点的8位二进制指纹,将二进制指纹转化为十进制指纹得到该像素点的LBP值;对每个关键帧进行小波分解,得到该关键帧的多级图像,计算该关键帧的每级图像的LBP特征,将两个关键帧中每级图像的相应位置的像素点进行LBP值对比,计算出该两个关键帧中每级图像的相似性,根据每级图像的相似度投票决定两个关键帧是否相似;所述衣服相似分析为:根据所提取的衣服位置,计算每个衣服位置的直方图特征,利用相关度算法计算每个衣服位置的相似度,根据衣服位置的相似度判断两个关键帧是否相似;所述视频主持人的特征至少包括视频主持人在视频图像中的位置特征、数量特征、出现次数特征、每次出现时长特征、出现时间间隔特征、人脸特征和衣服特征中的一种或多种组合;所述人脸识别处理步骤S2还包括人脸过滤处理:在定位出每个灰度图像中的人脸位置后,滤除符合过滤条件的人脸位置;所述过滤条件至少包括以下条件中的一种或多种组合:① 滤除人脸位置区域的像素尺寸小于预设像素尺寸的人脸位置;② 若一个灰度图像中识别出多个人脸,滤除人脸位置区域相互重叠的人脸位置;③ 若一个灰度图像中识别出多个人脸,如果距离小于预设距离,则视为一个人脸;④ 在灰度图像中划分非视频主持人区域,滤除出现在该非视频主持人区域的人脸位置;⑤ 在人脸位置中进行眼睛识别,滤除没有眼睛的人脸位置;所述衣服识别处理步骤S3还包括衣服过滤处理:在定位出每个灰度图像中的衣服位置后,滤除超越灰度图像边界和/或衣服面积小于人脸面积的衣服位置;步骤S5还包括S504,对每个类别的关键帧用类别名称以及个数进行描述标记。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都索贝数码科技股份有限公司,未经成都索贝数码科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610030286.7/,转载请声明来源钻瓜专利网。