[发明专利]一种网络动画中的文字定位及识别方法有效

申请号：	201010111374.2	申请日：	2010-02-10
公开（公告）号：	CN102147863A	公开（公告）日：	2011-08-10
发明（设计）人：	张树武;刘杰;梁伟	申请（专利权）人：	中国科学院自动化研究所
主分类号：	G06K9/20	分类号：	G06K9/20;G06K9/46
代理公司：	中科专利商标代理有限责任公司 11021	代理人：	梁爱荣
地址：	100080 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明是一种网络动画中的文字定位及识别方法，该方法充分利用网络动画的结构分析技术，将网络动画中的内嵌编码文字直接提取出来，并将网络动画分解为基本形状，而基本形状是构成网络动画的主要元素。接下来针对每个基本形状，利用基于连通域的启发合并、特征聚类的两阶段文字定位方法定位基本形状中的非内嵌文字，再利用基于笔画宽度直方图的噪声过滤方法，合理地将非文字连通域过滤掉，从而将所有非内嵌文字定位出来，然后利用梯度直方图特征识别非内嵌文字。最后将识别出的非内嵌文字和内嵌文字返回给用户。
搜索关键词：	一种网络动画中的文字定位识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种网络动画中的文字定位及识别方法，其特征在于，将网络动画结构分析技术与光学字符识别技术结合，直接提取网络动画文件中的编码内嵌文字，并利用一种基于连通域的启发合并、特征聚类的两阶段文字定位算法定位非内嵌文字，利用一种基于笔画宽度直方图的噪声过滤算法去除非文字连通域，最后利用基于梯度直方图特征识别非内嵌文字，该方法的步骤为：步骤S1：利用网络动画结构分析技术，分析给定网络动画文件的内容，如果存在DefineText标签，DefineText2标签之一，则将其中TextRecords域中FontID所定义的编码内嵌文字直接提取出来；步骤S2：利用网络动画结构分析技术，将网络动画分解为若干基本形状，再将基本形状转化为无失真压缩图像；基本形状是构成网络动画的元素，它包含网络动画中的全部非内嵌文字且背景更加简单，从而提高光学字符识别技术的准确性；步骤S3：针对每个基本形状转化后的图像，利用基于连通域的启发合并、特征聚类的两阶段文字定位算法，将基本形状中的非内嵌文字图像准确定位，获得非内嵌文字定位图像和错误定位的非文字连通图像；步骤S4：利用基于笔画宽度直方图的噪声过滤算法，将上述错误定位出的非文字连通域图像过滤掉；步骤S5：利用基于梯度直方图特征识别非内嵌文字，最后将识别出的非内嵌文字与编码内嵌文字返回给用户。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所，未经中国科学院自动化研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201010111374.2/，转载请声明来源钻瓜专利网。

上一篇：一种基于参数化多普勒瞬态模型的列车轮对轴承故障瞬态特征检测方法
下一篇：一种驱动微博信息的方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种网络动画中的文字定位及识别方法有效

专利文献下载