[发明专利]文本检测方法、电子设备及计算机可读介质有效
申请号: | 202010786573.7 | 申请日: | 2020-08-07 |
公开(公告)号: | CN111738233B | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 张子浩;李兵;杨家博 | 申请(专利权)人: | 北京易真学思教育科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰;兰淑铎 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 检测 方法 电子设备 计算机 可读 介质 | ||
1.一种文本检测方法,其特征在于,包括:
对包含有文本的待检测图像进行文本检测,获取所述待检测图像中的多个文本预测框;
从所述多个文本预测框中确定待合并的文本预测框;
根据所述待合并的文本预测框的宽度与所述待检测图像的宽度之间的关系,对所述待合并的文本预测框中的文本预测框进行合并,获得合并框;
根据所述合并框,确定所述待检测图像的文本检测结果;
所述对包含有文本的待检测图像进行文本检测,获取所述待检测图像中的多个文本预测框,包括:
将包含有文本的待检测图像输入EAST模型,通过所述EAST模型的特征提取层对所述待检测图像进行特征提取,获取四通道的、不同尺度的特征映射图;对最低尺度的特征映射图进行空洞卷积,通过所述EAST模型的特征融合层对进行了空洞卷积后的特征映射图和所述四通道中的其它尺度的特征映射图进行特征融合,获取融合特征图;对所述融合特征图进行卷积,并映射为用于表征所述待检测图像中的多个文本预测框的几何图形特征图和分数特征图。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待合并的文本预测框的宽度与所述待检测图像的宽度之间的关系,对所述待合并的文本预测框中的文本预测框进行合并,获得合并框,包括:
获取待合并的文本预测框的顶点坐标和预测框权重;
根据所述顶点坐标和所述预测框权重,以及所述待合并的文本预测框的宽度与所述待检测图像的宽度之间的关系,对所述待合并的文本预测框中的文本预测框进行合并,获得合并框。
3.根据权利要求2所述的方法,其特征在于,所述根据所述顶点坐标和所述预测框权重,以及所述待合并的文本预测框的宽度与所述待检测图像的宽度之间的关系,对所述待合并的文本预测框中的文本预测框进行合并,包括:
从待合并的文本预测框中确定基准框,从除所述基准框外的其它文本预测框中选择与所述基准框进行合并的准合并框;
根据所述基准框的顶点坐标和所述准合并框的顶点坐标,分别确定所述基准框的宽度和所述准合并框的宽度;
若所述基准框的宽度和所述准合并框的宽度均小于预设宽度阈值,则按照第一合并规则,根据所述基准框的顶点坐标和所述准合并框的顶点坐标,以及,所述基准框的预测框权重和所述准合并框的预测框权重,对所述基准框和所述准合并框进行合并;
若所述基准框的宽度和所述准合并框的宽度中,至少有一个大于所述预设宽度阈值,则按照第二合并规则,根据所述基准框的顶点坐标和所述准合并框的顶点坐标,以及,所述基准框的预测框权重和所述准合并框的预测框权重,对所述基准框和所述准合并框进行合并;
其中,所述预设宽度阈值根据所述待检测图像的宽度设定。
4.根据权利要求3所述的方法,其特征在于,所述按照第一合并规则,根据所述基准框的顶点坐标和所述准合并框的顶点坐标,以及,所述基准框的预测框权重和所述准合并框的预测框权重,对所述基准框和所述准合并框进行合并,包括:
分别计算所述基准框的顶点坐标与所述基准框的预测框权重的第一乘积,所述准合并框的顶点坐标与所述准合并框的预测框权重的第二乘积,以及,所述基准框的预测框权重和所述准合并框的预测框权重的权重之和,根据所述第一乘积、所述第二乘积和所述权重之和,对所述基准框和所述准合并框进行合并。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易真学思教育科技有限公司,未经北京易真学思教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010786573.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:长短螺旋锚
- 下一篇:一种大型表演动态舞台数字显示映射方法