[发明专利]一种视频文本提取的方法在审
申请号: | 201610479702.1 | 申请日: | 2016-06-27 |
公开(公告)号: | CN107545210A | 公开(公告)日: | 2018-01-05 |
发明(设计)人: | 张师群;罗旻 | 申请(专利权)人: | 北京新岸线网络技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 文本 提取 方法 | ||
1.一种视频文本提取的方法,其特征在于,包括:
将视频序列分割成单个镜头;
在单个视频帧序列中检测到和定位出候选文本的具体位置;
在文本定位的基础上,在视频镜头内部对文本进行跟踪,得到同一文本对象在连续多帧的文本区域序列;
利用文本跟踪得到的文本序列对文本进行增强,抑制背景,然后进行二值化,得到二值化文本图像;
对二值化后的文本图像进行文本识别,得到文本的字符序列信息。
2.如权利要求1所述的方法,其特征在于,所述定位,具体包括以下步骤:
预处理、粗定位、投影切分和筛选。
3.如权利要求1所述的方法,其特征在于,所述跟踪,采用以下方式:
位置判断、时序判断和维护跟踪数组判断。
4.如权利要求1所述的方法,其特征在于,所述分割之前还包括预分割,具体包括:
当所述视频图像为彩色图像,将所述视频图像转化为灰度图像;
对所述文本块所在区域图像进行二值化处理,分离图像中的字符和背景以确定字符边界;
对生成的二值化图像进行连通域分析,以获得字符笔画的位置和尺寸信息。
5.如权利要求1所述的方法,其特征在于,还包括:
对视频图像的版面进行分析,获取视频图像中的文本特征,将得到的文本信息进行组织、分类。
6.一种视频文本提取的系统,其特征在于,包括:
视频镜头分割模块,用于将视频序列分割成单个镜头;
文本定位模块,用于在单个视频帧序列中检测到和定位出候选文本的具体位置;
文本跟踪模块,用于在文本定位的基础上,在视频镜头内部对文本进行跟踪,得到同一文本对象在连续多帧的文本区域序列;
增强和二值化模块,用于利用文本跟踪得到的文本序列对文本进行增强,抑制背景,然后进行二值化,得到二值化文本图像;
文本识别模块,用于对二值化后的文本图像进行文本识别,得到文本的字符序列信息。
7.如权利要求6所述的系统,其特征在于,所述文本定位模块,具体包括以下:
预处理子模块、粗定位子模块、投影切分子模块和筛选子模块。
8.如权利要求6所述的系统,其特征在于,所述文本跟踪模块,采用以下方式:
位置判断子模块、时序判断子模块和维护跟踪数组判断子模块。
9.如权利要求6所述的系统,其特征在于,还包括预分割模块,具体包括:
转化子模块,用于当所述视频图像为彩色图像,将所述视频图像转化为灰度图像;
分离子模块,用于对所述文本块所在区域图像进行二值化处理,分离图像中的字符和背景以确定字符边界;
分析子模块,用于对生成的二值化图像进行连通域分析,以获得字符笔画的位置和尺寸信息。
10.如权利要求6所述的系统,其特征在于,还包括:
版面分析模块,用于对视频图像的版面进行分析,获取视频图像中的文本特征,将得到的文本信息进行组织、分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京新岸线网络技术有限公司,未经北京新岸线网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610479702.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:胰肠吻合支架管道装置
- 下一篇:云端数据处理系统