[发明专利]一种基于字体颜色的新闻标题识别方法及装置有效
申请号: | 201810167585.4 | 申请日: | 2018-02-28 |
公开(公告)号: | CN108388872B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 刘楠 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/46 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 字体 颜色 新闻标题 识别 方法 装置 | ||
1.一种基于字体颜色的新闻标题识别方法,其特征在于,包括:
当目标视频帧中包含标题候选区域时,从所述标题候选区域中确定跟踪区域,所述目标视频帧为将边缘图像进行边缘加强后的视频帧;
识别所述目标视频帧的跟踪区域内的图像的字体像素点,并计算所述字体像素点的RGB均值;依据所述字体像素的RGB均值,判断所述目标视频帧的跟踪区域的图像是否符合所述字体颜色条件;当所述目标视频帧的跟踪区域内的图像符合字体颜色条件时,将所述目标视频帧作为待跟踪视频帧;所述字体颜色条件包括所述目标视频帧的跟踪区域内的图像的字体像素的RGB均值在预设的RGB均值范围内;
对所述待跟踪视频帧进行跟踪,以确定所述待跟踪视频帧是否满足第一跟踪条件,并将满足所述第一跟踪条件的待跟踪视频帧进行计数,得到第一跟踪帧数;
当所述第一跟踪帧数大于等于预设的第一帧数阈值时,确定所述目标视频帧的标题候选区域中包含新闻标题。
2.根据权利要求1所述的方法,其特征在于,所述识别所述目标视频帧的跟踪区域内的图像的字体像素点,包括:
对所述目标视频帧中的跟踪区域的图像进行二值化处理,得到所述跟踪区域的二值图像;
分别对所述跟踪区域的二值图像的行和列进行扫描,计算背景像素值和背景像素数;所述背景像素值为所述跟踪区域的二值图像中满足预设条件的行和列中参考像素值的和,所述背景像素数为所述跟踪区域的二值图像中满足预设条件的行和列的数量;所述参考像素值为在扫描所述跟踪区域的二值图像时每行或者每列的第一个像素;
计算所述背景像素值和所述背景像素数的比值,得到背景像素均值;
根据所述背景像素均值与预设的灰度均值的关系,确定出所述目标视频帧跟踪区域内的图像的字体像素点。
3.根据权利要求2所述的方法,其特征在于,所述对所述跟踪区域的二值图像的行和列进行扫描,计算背景像素值和背景像素数,包括:
分别对所述跟踪区域的二值图像中每一行进行扫描,将扫描的每行的第一个像素点的像素值作为参考像素值;
将满足第一背景条件的每一行中的参考像素值进行累加,得到第一背景像素值;所述第一背景条件为,任意一行中像素点的像素值不等于该行的所述参考像素值的所有像素点的数量大于预设的第一数量阈值;
将满足第一背景条件的行的数量进行累加,得到第一背景像素数;
分别对所述跟踪区域的二值图像中的每一列进行扫描,将扫描的每列的第一个像素点的像素值作为参考像素值;
将满足第二背景条件的每一列中的参考像素值进行累加,得到第二背景像素值;所述第二背景条件为任意一列中像素点的像素值不等于该列的所述参考像素值的像素点的数量大于预设的第一数量阈值;
将满足第二背景条件的列的数量进行累加,得到第二背景像素数;
计算所述第一背景像素数和所述第二背景像素数的和,得到背景像素数;
计算所述第一背景像素值和所述第二背景像素值的和,得到背景像素值。
4.根据权利要求2所述的方法,其特征在于,所述根据所述背景像素均值与灰度均值的关系,确定出所述目标视频帧跟踪区域图像中的字体像素点,包括:
判断所述背景像素均值是否小于所述灰度均值;
若所述背景像素均值小于所述灰度均值,则将所述背景像素均值替换为预设的像素值;
基于所述预设的像素值,确定所述跟踪区域的二值图像中属于字体像素点的位置;
基于所述跟踪区域的二值图像中属于字体的像素点的位置,识别出所述目标视频帧中跟踪区域内的图像中的字体像素点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810167585.4/1.html,转载请声明来源钻瓜专利网。