[发明专利]一种文本检测方法、装置及电子设备在审
申请号: | 202010537495.7 | 申请日: | 2020-06-12 |
公开(公告)号: | CN111666941A | 公开(公告)日: | 2020-09-15 |
发明(设计)人: | 张水发 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 孙翠贤;高莺然 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 检测 方法 装置 电子设备 | ||
1.一种文本检测方法,其特征在于,所述方法,包括:
获取待检测图像;
从所述待检测图像中,确定关于文本行的备选区域;
确定所述备选区域的锚点特征;其中,所述锚点特征包括所述备选区域的倾斜角度和尺寸特征两类特征信息;
利用所述备选区域的锚点特征,以及预设的锚点数据与文本行识别结果的对应关系,确定所述备选区域是否为文本行;其中,所述文本行识别结果用于表征区域是否为文本行的结果;所述锚点数据为基于预设的多个样本锚点特征所确定出的数据;
当所述备选区域为文本行时,将所述备选区域的内容确定为所检测得到的目标文本。
2.根据权利要求1所述的方法,其特征在于,所述锚点数据与文本行识别结果的对应关系包括:锚点类别与文本行识别结果的对应关系;
所述利用所述备选区域的锚点特征,以及预设的锚点数据与文本行识别结果的对应关系,确定所述备选区域是否为文本行的步骤,包括:
确定所述备选区域的锚点特征所属的目标锚点类别;
利用所述目标锚点类别,以及预设的锚点类别与文本行识别结果的对应关系,确定所述备选区域是否为文本行。
3.根据权利要求2所述的方法,其特征在于,所述关于锚点类别与文本行识别结果的对应关系的确定方式,包括:
获取第一样本图像的特征图,以及基于第二样本图像中各个文本行的锚点特征得到的各个锚点类别;
基于所述特征图和所述各个锚点类别,进行关于文本区域的类别回归和检测框回归,得到多个初始文本区域;
在所述特征图中截取各个初始文本区域对应的待回归文本区域;
对所截取到的多个待回归文本区域进行类别回归、检测框回归和角度回归,得到关于锚点类别与文本行识别结果的对应关系。
4.根据权利要求3所述的方法,其特征在于,所述各个锚点类别的确定方式,包括:
确定所述第二样本图像中各个文本行的倾斜角度和尺寸特征,得到角度数据组和尺寸数据组;
对所述角度数据组和所述尺寸数据组分别进行聚类,得到第一数量个角度聚类结果和第二数据量个尺寸聚类结果;
从所述第一数量个角度聚类结果和所述第二数据量个尺寸聚类结果中,分别选取一个聚类结果的聚类中心,构成一个锚点类别,得到锚点类别;其中,不同锚点类别包括的两类特征信息不完全相同。
5.根据权利要求3或4所述的方法,其特征在于,在所述对所截取到的多个待回归文本区域进行类别回归、检测框回归和角度回归的步骤之前,所述方法还包括:
提取所截取到的多个待回归文本区域中的倾斜文本区域的角度特征,并基于所述角度特征,对所述倾斜文本区域进行旋转转换;
所述对所截取到的多个待回归文本区域进行类别回归、检测框回归和角度回归的步骤,包括:
对所截取到的多个待回归文本区域中的非倾斜文本区域和旋转转换后的所述倾斜文本区域进行类别回归、检测框回归和角度回归。
6.根据权利要求3或4所述的方法,其特征在于,在所述在所述特征图中截取各个初始文本区域对应的待回归文本区域的步骤之前,所述方法还包括:
对各个初始文本区域执行非极大值抑制NMS操作,得到各个初始文本区域的建议检测区域;
所述在所述特征图中截取各个初始文本区域对应的待回归文本区域的步骤,包括:
在所述特征图中截取所得到的各个建议文本区域对应的待回归文本区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010537495.7/1.html,转载请声明来源钻瓜专利网。