[发明专利]一种文本检测方法、装置、设备及可读存储介质有效
申请号: | 201910208074.7 | 申请日: | 2019-03-19 |
公开(公告)号: | CN109948533B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 毛钺铖;王丹;王光新;韩涛;宋腾飞;贾若然;李国玉;谭昶 | 申请(专利权)人: | 讯飞智元信息科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王云晓;王宝筠 |
地址: | 230088 安徽省合肥市高*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了一种文本检测方法、装置、设备及可读存储介质,方法包括:从待检测文本中获取文本框相关信息,文本框的相关信息至少包括四个顶点集,一顶点集对应一顶点类别;以三个有序顶点为一组生成候选文本框,获得候选文本框集,生成一候选文本框的三个有序顶点取自四个顶点集中的三个不同顶点集,且该三个有序顶点中的每个顶点在对应的候选文本框中所属的顶点类别与其所属的顶点集对应的顶点类别一致,且该三个有序顶点形成的夹角与预设角度的差值的绝对值小于预设角度阈值;从候选文本框集中确定待检测文本中文本行的目标文本框。本申请提供的文本检测方法具有较高的检测效率和检测准确度,检测效果较好。 | ||
搜索关键词: | 一种 文本 检测 方法 装置 设备 可读 存储 介质 | ||
【主权项】:
1.一种文本检测方法,其特征在于,包括:从待检测文本中获取文本框的相关信息,其中,所述文本框为所述待检测文本中文本行的边框,一文本框由四个顶点组成,每个顶点对应一顶点类别,所述文本框的相关信息至少包括四个顶点集,一顶点集对应一顶点类别,其由多个文本框的顶点中属于同一顶点类别的顶点组成;以三个有序顶点为一组生成候选文本框,获得候选文本框集,其中,生成一候选文本框的三个有序顶点取自所述四个顶点集中的三个不同顶点集,且该三个有序顶点中的每个顶点在对应的候选文本框中所属的顶点类别与其所属的顶点集对应的顶点类别一致,且该三个有序顶点形成的夹角与预设角度的差值的绝对值小于预设角度阈值;从所述候选文本框集中确定所述待检测文本中文本行的目标文本框。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于讯飞智元信息科技有限公司,未经讯飞智元信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910208074.7/,转载请声明来源钻瓜专利网。