[发明专利]文本图片下划线识别方法、装置、计算机设备及存储介质有效

申请号：	202010173523.1	申请日：	2020-03-13
公开（公告）号：	CN111401352B	公开（公告）日：	2023-10-20
发明（设计）人：	郑泽重;范有文;谭江龙	申请（专利权）人：	深圳前海环融联易信息科技服务有限公司
主分类号：	G06V30/14	分类号：	G06V30/14;G06V30/148
代理公司：	深圳市精英专利事务所 44242	代理人：	巫苑明
地址：	518000 广东省深圳市前海深港合作区前***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本图片下划线识别方法装置计算机设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及文本图片下划线识别方法、装置、计算机设备及存储介质，该方法包括获取使用OPENCV对文本图片的识别结果，以得到初始识别结果；对初始识别结果进行长度和范围的过滤，以得到初始过滤结果；对初始过滤结果进行重复直线和印章直线的去除，以得到中间结果；对中间结果进行拓展和信息获取，以得到下划线对应的关键信息；反馈下划线对应的关键信息，以进行文本内容识别。本发明实现针对性地对于文本图片进行关键信息的下划线标注的识别和处理，且可将处理结果使用在文本图片关键信息文字的解析上，既可以提高下划线标注的识别效率和准确度，也可以提高文字解析的效率。

技术领域

本发明涉及图片识别方法，更具体地说是指文本图片下划线识别方法、装置、计算机设备及存储介质。

背景技术

随着信息技术的飞速发展，图片和视频数据量快速增长。对于海量图片或视频帧来说，根据画面中是否包含文本内容，可分类为文本图片和非文本图片。对于文本图片来讲，其包括的文本内容通常携带丰富的信息，是辅助理解和认知图片的重要信息来源，所以文本内容作为一个重要线索在诸如图片搜索、人机交互和盲人辅助系统等场景中被广泛挖掘和应用。

对于有些带有关键信息标注的文本图片而言，在其进行文本内容识别的过程中，会涉及到将这些关键信息标注对应的文本内容进行单独提取，以减短文本内容识别所花费的时间，现有技术一般或者使用OPENCV识别出文本图片中的直线等标注，但是并没有根据实际场景对这些标注进行扩展识别和处理，导致后续文本内容识别的效率较低，而且采用现有技术识别的效率也不高，且准确率较低。

因此，有必要设计一种新的方法，实现针对性地对于文本图片进行关键信息的下划线标注的识别和处理，且可将处理结果使用在文本图片关键信息文字的解析上，既可以提高下划线标注的识别效率和准确度，也可以提高文字解析的效率。

发明内容

本发明的目的在于克服现有技术的缺陷，提供文本图片下划线识别方法、装置、计算机设备及存储介质。

为实现上述目的，本发明采用以下技术方案：文本图片下划线识别方法，包括：

获取使用OPENCV对文本图片的识别结果，以得到初始识别结果；

对初始识别结果进行长度和范围的过滤，以得到初始过滤结果；

对初始过滤结果进行重复直线和印章直线的去除，以得到中间结果；

对所述中间结果进行拓展和信息获取，以得到下划线对应的关键信息；

反馈下划线对应的关键信息，以进行文本内容识别。

其进一步技术方案为：所述初始识别结果包括线段。

其进一步技术方案为：所述对初始识别结果进行长度和范围的过滤，以得到初始过滤结果，包括：

根据设定的直线长度阈值以及设定的位置范围对初始识别结果进行过滤，过滤出长度在设定的直线长度阈值且在文本图片内的位置落入到设定的位置范围内的初始识别结果，以得到初始过滤结果。