[发明专利]基于能量最小化的场景视频文本跟踪方法在审

申请号：	201811420007.3	申请日：	2018-11-26
公开（公告）号：	CN109583361A	公开（公告）日：	2019-04-05
发明（设计）人：	殷绪成;蒙丽宇;裴唯一;田澍;朱超	申请（专利权）人：	北京科技大学
主分类号：	G06K9/00	分类号：	G06K9/00
代理公司：	北京金智普华知识产权代理有限公司 11401	代理人：	皋吉甫
地址：	100083***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	能量模型场景视频文本跟踪能量最小化互斥跟踪计算机视觉领域线性能量函数跟踪轨迹轨迹集合融合检测损失能量整体能量最小化求解集合文本检测
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于能量最小化的场景视频文本跟踪方法，其特征在于，所述方法提供了文本的互斥能量模型，并提出融合检测能量模型、表观能量模型和互斥能量模型的线性能量函数，通过对全局能量的最小化，求得文本跟踪的最佳匹配状态。

2.根据权利要求1所述的方法，其特征在于，所述方法具体包括：

步骤1：描述跟踪模型的融合检测能量模型、表观能量模型和互斥能量模型的线性能量函数；

步骤2：对跟踪模型进行求解；

步骤3：具体跟踪过程。

3.根据权利要求2所述的方法，其特征在于，通过检测模型确定目标为文本，通过表观能量模型，区分外观、大小、位置区别较大的文本目标，通过互斥能量模型，引入同一帧中不同文本之间的联系，进一步区分相近相似文本。

4.根据权利要求2所述的方法，其特征在于，融合检测能量模型、表观能量模型和互斥能量模型的线性能量函数表示为：

其中，E_det是检测能量模型，E_app是目标表观能量模型，E_exc是互斥能量模型，α和β是加权系数，N是视频出现的目标总数，E(T_i,t)是第i个目标在第t时刻的递推能量，s_i和e_i是第i个目标的起止时间，出现在第t帧中的目标区域i表示为T_i,t，D_det(T_i,t)、D_app(T_i,t)和D_exc(T_i,t)分别表示对目标T_i,t的检测能量、表观能量和互斥能量。

5.根据权利要求4所述的方法，其特征在于，所述检测能量模型的检测能量函数E_det的定义如下，

D_det(T_i,t)＝1-C_det(T_i,t)

其中N为整个视频中的目标总数，s_i和e_i为第i个目标区域出现的起始帧号和结束帧号，出现在第t帧中的目标区域i表示为T_i,t，C_det(T_i,t)由文本检测器提供，表示区域i是文本的置信度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京科技大学，未经北京科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811420007.3/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于时空信息和层级表示的视频人体行为识别方法
下一篇：图像卡通化方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于能量最小化的场景视频文本跟踪方法在审

专利文献下载