[发明专利]文本检测方法、装置、计算机设备和存储介质在审
申请号: | 202011020108.9 | 申请日: | 2020-09-25 |
公开(公告)号: | CN112101386A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 郭双双;李斌;龚星 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06N3/04 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 唐彩琴 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 检测 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种文本检测方法、装置、计算机设备和存储介质,所述方法包括:获取待检测图片;基于不同尺度提取所述待检测图片的图片特征;分别根据各尺度的图片特征确定各尺度对应的所述待检测图片中各字符的字符相关信息;整合各尺度对应的各所述字符相关信息,得到所述待检测图片中各字符的字符检测结果。上述方法通过从不同尺度提取图片特征来实现字符的检测,可以适应自然场景中不同尺度的文字,从而避免因图片尺寸等不一致导致的文本检测不准确的问题。
技术领域
本申请涉及图像处理技术领域,特别是涉及一种文本检测方法、装置、计算机设备和存储介质。
背景技术
自然场景下的文本检测方法可以用于定位图像中的文本信息,以便于后续对检测到的包含文字的文本框图片进行文字识别,最终获得结构化信息。文本检测方法广泛应用于图像检索、视频分析、自动驾驶等领域,而且文本检测的准确率影响着后续文本识别及信息结构化等流程的准确率,因此开发一种有效的自然场景下的文本检测算法显得至关重要。
然而在实际自然场景中,通常会存在各种不可控的干扰因素,如图像亮度变化、拍摄图像存在畸变、文字尺度不一、文字弯曲、异物遮挡等问题,这些问题使得自然场景下的文本检测方法依然是一项艰巨的任务。近年来,随着深度学习技术的快速发展,自然场景下的文本检测技术也取得了飞跃式进步。
目前,较为常用的文本检测可通过人工智能技术实现,主要包括文本检测和文字识别模型,然而这种方法通常对精细程度要求很高,如果某个字符的位置定位错误,将严重影响后续文字识别和信息结构化的性能,而现实场景中由于拍摄条件的局限性和复杂性,不同使用者使用不同硬件拍摄的文字图像存在较大差异,主要存在着亮度不一、尺寸不一、角度不一、存在遮挡物等问题,如此容易导致文本检测的结果不准确。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高检测结果准确性的文本检测方法、装置、计算机设备和存储介质。
一种文本检测方法,所述方法包括:
获取待检测图片;
基于不同尺度提取所述待检测图片的图片特征;
分别根据各尺度的图片特征确定各尺度对应的所述待检测图片中各字符的字符相关信息;
整合各尺度对应的各所述字符相关信息,得到所述待检测图片中各字符的字符检测结果。
一种文本检测装置,所述装置包括:
获取模块,用于获取待检测图片;
特征提取模块,用于基于不同尺度提取所述待检测图片的图片特征;
字符信息确定模块,用于分别根据各尺度的图片特征确定各尺度对应的所述待检测图片中各字符的字符相关信息;
结果整合模块,用于整合各尺度对应的各所述字符相关信息,得到所述待检测图片中各字符的字符检测结果。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待检测图片;
基于不同尺度提取所述待检测图片的图片特征;
分别根据各尺度的图片特征确定各尺度对应的所述待检测图片中各字符的字符相关信息;
整合各尺度对应的各所述字符相关信息,得到所述待检测图片中各字符的字符检测结果。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待检测图片;
基于不同尺度提取所述待检测图片的图片特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011020108.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:转氨酶突变体及其应用
- 下一篇:可变容量型增压器