[发明专利]一种基于深度度量模型的文本检测方法在审

申请号：	201810568042.3	申请日：	2018-06-05
公开（公告）号：	CN109002463A	公开（公告）日：	2018-12-14
发明（设计）人：	赵永彬;刚毅凝;李巍;刘树吉;陈硕;熊先亮;梁凯;周杨浩;杨育彬;郝跃冬;刘嘉华;康睿	申请（专利权）人：	国网辽宁省电力有限公司信息通信分公司;南京大学;南京南瑞信息通信科技有限公司
主分类号：	G06F17/30	分类号：	G06F17/30;G06K9/62
代理公司：	江苏圣典律师事务所 32237	代理人：	胡建华;于瀚文
地址：	110006 辽***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于深度度量模型的文本检测方法，包括：步骤1，使用MSER检测算法，得到字符级别的候选区域。步骤2，使用分类器对候选区域进行过滤，去掉非字符区域。步骤3，根据几何位置信息，将已得到的字符聚类成文本行。步骤4，根据启发式规则，对文本行进行分割，分割成每一个具体的词。步骤5，构造词级别的训练集。步骤6，训练深度度量学习模型。步骤7，使用步骤6得到的深度度量模型，对文本框进行分类，得到最终的文本框区域。
搜索关键词：	度量候选区域文本检测文本框非字符区域启发式规则几何位置检测算法字符级别字符聚类分类器文本行训练集分割过滤分类学习
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于深度度量模型的文本检测方法，其特征在于，包括如下步骤：步骤1，使用MSER检测算法，对输入图像进行检测，得到字符级别的候选区域；步骤2，构建字符级别的训练数据集，根据已标注好的字符区域，截取字符区域内文字信息作为正类，对于步骤1得到的候选区域，选取与正类没有重合的候选区域作为负类，正类和负类组成字符级别的训练数据集，作为输入，训练深度神经网络，使用此训练好的深度神经网络作为分类器，对候选区域的候选字符进行分类，筛选过滤，去掉负类；步骤3，选取每个候选区域的中心点，根据每个中心点的横坐标，设置较小的阀值，将在这阀值以内的候选字符区域按照水平方向，全部划分到同一个文本行区域；步骤4，计算步骤3得到的文本行区域中每个字符之间的平均距离，对于大于平均距离两倍的两个字符进行分割，将其划分为两个不同的单词，反之，将不到平均距离两倍的两个字符归属于同一单词，从而得到词级别的候选区域；步骤5，根据步骤4得到的词级别的候选区域，每一个字符都属于一个单词，一个单词是由至少一个字符构成，把构造出的所有单词作为词级别的数据集，根据词级别的文本标注信息，截取对应区域作为正类，将与正类没有重合的区域作为负类；步骤6，根据步骤5得到的正类和负类，将它们作为输入，搭建深度度量模型并训练，该训练好的模型能够用于词级别的分类；步骤7，根据步骤6得到的深度度量模型，对待测试图像进行过滤，得到最终的文本区域。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于国网辽宁省电力有限公司信息通信分公司;南京大学;南京南瑞信息通信科技有限公司，未经国网辽宁省电力有限公司信息通信分公司;南京大学;南京南瑞信息通信科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810568042.3/，转载请声明来源钻瓜专利网。

上一篇：一种实现分布式事务的方法及系统
下一篇：利用对话界面自动报告分析和分发建议的方法和系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度度量模型的文本检测方法在审

专利文献下载