[发明专利]一种视频文本提取的方法在审

申请号：	201610479702.1	申请日：	2016-06-27
公开（公告）号：	CN107545210A	公开（公告）日：	2018-01-05
发明（设计）人：	张师群;罗旻	申请（专利权）人：	北京新岸线网络技术有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/32
代理公司：	暂无信息	代理人：	暂无信息
地址：	100084 北京市海淀区中***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种视频文本提取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种视频文本提取的方法，其特征在于，包括：

将视频序列分割成单个镜头；

在单个视频帧序列中检测到和定位出候选文本的具体位置；

在文本定位的基础上，在视频镜头内部对文本进行跟踪，得到同一文本对象在连续多帧的文本区域序列；

利用文本跟踪得到的文本序列对文本进行增强，抑制背景，然后进行二值化，得到二值化文本图像；

对二值化后的文本图像进行文本识别，得到文本的字符序列信息。

2.如权利要求1所述的方法，其特征在于，所述定位，具体包括以下步骤：

预处理、粗定位、投影切分和筛选。

3.如权利要求1所述的方法，其特征在于，所述跟踪，采用以下方式：

位置判断、时序判断和维护跟踪数组判断。

4.如权利要求1所述的方法，其特征在于，所述分割之前还包括预分割，具体包括：

当所述视频图像为彩色图像，将所述视频图像转化为灰度图像；

对所述文本块所在区域图像进行二值化处理，分离图像中的字符和背景以确定字符边界；

对生成的二值化图像进行连通域分析，以获得字符笔画的位置和尺寸信息。

5.如权利要求1所述的方法，其特征在于，还包括：

对视频图像的版面进行分析，获取视频图像中的文本特征，将得到的文本信息进行组织、分类。

6.一种视频文本提取的系统，其特征在于，包括：

视频镜头分割模块，用于将视频序列分割成单个镜头；

文本定位模块，用于在单个视频帧序列中检测到和定位出候选文本的具体位置；

文本跟踪模块，用于在文本定位的基础上，在视频镜头内部对文本进行跟踪，得到同一文本对象在连续多帧的文本区域序列；

增强和二值化模块，用于利用文本跟踪得到的文本序列对文本进行增强，抑制背景，然后进行二值化，得到二值化文本图像；

文本识别模块，用于对二值化后的文本图像进行文本识别，得到文本的字符序列信息。

7.如权利要求6所述的系统，其特征在于，所述文本定位模块，具体包括以下：

预处理子模块、粗定位子模块、投影切分子模块和筛选子模块。

8.如权利要求6所述的系统，其特征在于，所述文本跟踪模块，采用以下方式：

位置判断子模块、时序判断子模块和维护跟踪数组判断子模块。

9.如权利要求6所述的系统，其特征在于，还包括预分割模块，具体包括：

转化子模块，用于当所述视频图像为彩色图像，将所述视频图像转化为灰度图像；

分离子模块，用于对所述文本块所在区域图像进行二值化处理，分离图像中的字符和背景以确定字符边界；

分析子模块，用于对生成的二值化图像进行连通域分析，以获得字符笔画的位置和尺寸信息。

10.如权利要求6所述的系统，其特征在于，还包括：

版面分析模块，用于对视频图像的版面进行分析，获取视频图像中的文本特征，将得到的文本信息进行组织、分类。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京新岸线网络技术有限公司，未经北京新岸线网络技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201610479702.1/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载