[发明专利]视频中logo区域的标记方法、装置及电子设备有效
申请号: | 201911203383.1 | 申请日: | 2019-11-29 |
公开(公告)号: | CN111126372B | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 李果;张玉梅;张文杰;贺沁雯;李虎;樊鸿飞;蔡媛 | 申请(专利权)人: | 北京金山云网络技术有限公司;北京金山云科技有限公司 |
主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V10/762 |
代理公司: | 北京博遵律师事务所 11761 | 代理人: | 马佑平 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 logo 区域 标记 方法 装置 电子设备 | ||
1.一种视频中logo区域的标记方法,其特征在于,所述方法包括:
从视频帧中识别出至少一个文字区域;
对每个所述文字区域对应的扩展区域内的像素点分别进行聚类处理,获得聚类结果,其中,所述聚类结果包括:以所述扩展区域中的logo文字的颜色为聚类中心的第一像素点集合和以所述扩展区域中的logo背景的颜色为聚类中心的第二像素点集合,所述扩展区域包括对应的所述文字区域,所述扩展区域的面积大于对应的所述文字区域的面积;
根据所述聚类结果,确定每个所述文字区域对应的待定logo区域;其中,所述待定logo区域中包含对应的所述文字区域;
将满足预设条件的所述待定logo区域标记为所述视频帧中的目标logo区域;
所述预设条件包括:所述待定logo区域的面积大于预设面积;所述待定logo区域的角点数量小于预设角点数量;所述待定logo区域中的logo背景区域完全被包含在所述扩展区域内;所述待定logo区域中的logo文字区域完全被包含在所述logo背景区域内;所述待定logo区域中的logo背景区域与所述扩展区域的面积比例大于预设比例值;以及,所述待定logo区域中的logo背景区域的长宽比符合预设范围区间。
2.根据权利要求1所述的方法,其特征在于,所述从视频帧中识别出至少一个文字区域,包括:
通过深度学习文字检测算法,从所述视频帧中识别出所述至少一个文字区域。
3.根据权利要求1所述的方法,其特征在于,所述对每个所述文字区域对应的扩展区域内的像素点分别进行聚类处理,获得聚类结果,包括:
利用聚类算法对每个所述文字区域内的像素点进行2类别聚类计算,得到对应的2个聚类中心及聚类模型;其中,所述聚类中心包括以logo文字的颜色和logo背景的颜色;
将每个所述文字区域按照预设比例扩大,得到对应的扩展区域;
通过所述聚类模型计算对应的扩展区域内,每个像素点的类别,以及每个所述像素点到相应类别的聚类中心的距离;
在所述像素点到相应类别的聚类中心的距离符合预设阈值时,确定以所述扩展区域中logo文字的颜色为聚类中心的第一像素点集合,以及确定以所述扩展区域中logo背景的颜色为聚类中心的第二像素点集合。
4.根据权利要求1所述的方法,其特征在于,所述将满足预设条件的所述待定logo区域标记为所述视频帧中的目标logo区域,包括:
在满足所述预设条件的所述待定logo区域的边缘处添加虚线框以进行标记;或者,
对满足所述预设条件的所述待定logo区域内的像素点添加标签以进行标记。
5.根据权利要求1所述的方法,其特征在于,在所述将满足预设条件的所述待定logo区域标记为所述视频帧中的目标logo区域之后,所述方法还包括:
将用于展示的目标logo图像添加至所述目标logo区域中。
6.一种视频中logo区域的标记装置,其特征在于,所述装置包括:
识别模块,用于从视频帧中识别出至少一个文字区域;
获取模块,用于对每个所述文字区域对应的扩展区域内的像素点分别进行聚类处理,获得聚类结果,其中,所述聚类结果包括:以所述扩展区域中的logo文字的颜色为聚类中心的第一像素点集合和以所述扩展区域中的logo背景的颜色为聚类中心的第二像素点集合,所述扩展区域包括对应的所述文字区域,所述扩展区域的面积大于对应的所述文字区域的面积;
确定模块,用于根据所述聚类结果,确定每个所述文字区域对应的待定logo区域;其中,所述待定logo区域中包含对应的所述文字区域;
标记模块,用于将满足预设条件的所述待定logo区域标记为所述视频帧中的目标logo区域;所述预设条件包括:所述待定logo区域的面积大于预设面积;所述待定logo区域的角点数量小于预设角点数量;所述待定logo区域中的logo背景区域完全被包含在所述扩展区域内;所述待定logo区域中的logo文字区域完全被包含在所述logo背景区域内;所述待定logo区域中的logo背景区域与所述扩展区域的面积比例大于预设比例值;以及,所述待定logo区域中的logo背景区域的长宽比符合预设范围区间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山云网络技术有限公司;北京金山云科技有限公司,未经北京金山云网络技术有限公司;北京金山云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911203383.1/1.html,转载请声明来源钻瓜专利网。