[发明专利]场景文本检测系统和方法有效
申请号: | 201480081759.5 | 申请日: | 2014-09-05 |
公开(公告)号: | CN106796647B | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | 汤晓鸥;黄韡林;乔宇 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;王艳春 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 公开一种场景文本检测系统。该系统可包括最大稳定极值区域(MSER)检测器、经过训练的卷积神经网络(CNN)分类器、选择器和构造器。最大稳定极值区域(MSER)检测器可被配置成从图像中生成文本成分的集合,其中生成的文本成分排列成MSER树形结构。经过训练的卷积神经网络(CNN)分类器可被配置成将成分置信分数分配到文本成分的集合中的每个文本成分。选择器可被配置成从文本成分集合中选择具有所分配的成分置信分数中的较高成分置信分数的文本成分。构造器可被配置成使用所选择的文本成分来构造最终文本。也公开一种场景文本检测方法。 | ||
搜索关键词: | 场景 文本 检测 系统 方法 | ||
【主权项】:
1.一种场景文本检测系统,其包括:最大稳定极值区域检测器,其被配置成从图像中生成文本成分集合,其中生成的文本成分排序成最大稳定极值区域树形结构;卷积神经网络分类器,所述卷积神经网络分类器包括两个卷积层、至少一个平均池化层、和支持向量机分类器,以及其中,每个卷积层之后是平均池化层和多个滤波器,所述卷积神经网络分类器配置成将成分置信分数分配到所述文本成分集合中的每个文本成分;选择器,其被配置成从所述文本成分集合中选择具有分配的成分置信分数中的较高成分置信分数的文本成分;以及构造器,其被配置成使用选择的文本成分来构造最终文本,其中,所述两个卷积层的第一卷积层的滤波器被配置成通过使用非监督K均值来根据从预定训练集中提取的图像块集合进行学习以生成响应,并且所述两个卷积层的第二卷积层的滤波器被配置成通过反向传播从所述支持向量机分类器中生成的支持向量机分类误差来基于生成的所述响应进行学习以获取所述文本成分的所述成分置信分数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201480081759.5/,转载请声明来源钻瓜专利网。