[发明专利]目标文本区域选择的方法、装置、电子设备和存储介质有效
申请号: | 202010495989.3 | 申请日: | 2020-06-03 |
公开(公告)号: | CN111652204B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 许多;邓小兵;张春雨 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/148;G06V30/18;G06V30/19;G06V10/82;G06N3/04;G06N3/08;G06N3/0464;G06N3/0442 |
代理公司: | 广州智斧知识产权代理事务所(普通合伙) 44649 | 代理人: | 孔德超 |
地址: | 528850 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 文本 区域 选择 方法 装置 电子设备 存储 介质 | ||
本发明实施例涉及题目检测技术领域,公开了一种目标文本区域选择的方法、装置、电子设备和存储介质。该方法包括:获取目标图像;识别所述目标图像中的点击点坐标和题目区域掩码;根据所述点击点坐标、题目区域掩码以及预设规则确定目标题目区域。实施本发明实施例,其只需要根据点击点坐标和题目区域掩码就可以输出用户想要的意图题目区域,为后续的精准搜题和题目收录提供技术支持,并且可以支持各种排版和复杂情况,在各种情况下都具有良好的鲁棒性。
技术领域
本发明涉及题目检测技术领域,具体涉及一种目标文本区域选择的方法、装置、电子设备和存储介质。
背景技术
在点读场景或学习机场景中,经常会出现用户点击试卷、练习册以及书本等纸面,然后需要获取该点击点对应的意图题目区域,用于搜题或题目收录,其中搜题包括但不限于答案搜索、发音搜索以及近义词或反义词搜索等。对于这些场景下,输入为用户点击纸面的坐标和各个题目的区域,输出为用户想要的意图题目区域。当前这种场景的现有技术较少,但是实际意义却非常明显,正确返回意图题目可以给予用户最佳的用户体验,也为后续的搜题或题目收录提供了技术支持。
发明内容
针对所述缺陷,本发明实施例公开了一种目标文本区域选择的方法、装置、电子设备和存储介质,其通过点击点坐标和题目区域确定目标题目区域。
本发明实施例第一方面公开一种目标文本区域选择的方法,所述方法包括:
获取目标图像;
识别所述目标图像中的点击点坐标和题目区域掩码;
根据所述点击点坐标、题目区域掩码以及预设规则确定目标题目区域。
作为一种可选的实施方式,在本发明实施例第一方面中,所述识别所述目标图像中的点击点坐标,包括:
创建并训练基于颜色特征的深度学习网络识别模型;
将所述目标图像输入所述深度学习网络识别模型中,识别目标图像中的点击点,并确定所述点击点的坐标。
作为一种可选的实施方式,在本发明实施例第一方面中,识别所述目标图像中的题目区域掩码,包括:
将所述目标图像输入预先训练的题目检测网络模型,输出所述题目区域掩码以及每个题目区域掩码的置信度;
或者,
将所述目标图像并行输入预先训练的题目检测网络模型以及文字识别模型和图表检测网络模型,分别输出初始题目区域掩码、文字行掩码和图表掩码;
将所述初始题目区域掩码、文字行掩码和图表掩码进行融合,得到所述题目区域掩码,以所述初始题目区域掩码的置信度作为所述题目区域掩码的置信度。
作为一种可选的实施方式,在本发明实施例第一方面中,根据所述点击点坐标、题目区域掩码以及预设规则确定目标题目区域,包括:
检测所述点击点和题目区域掩码的位置关系;
如果所述点击点落入其中一个题目区域掩码内,则所述其中一个题目区域掩码为目标题目区域掩码;
如果所述点击点落入多个题目区域掩码内,则选取所述多个题目区域掩码中置信度最大的题目区域掩码作为目标题目区域掩码;
根据所述目标题目区域掩码确定目标题目区域。
作为一种可选的实施方式,在本发明实施例第一方面中,根据所述点击点坐标、题目区域掩码以及预设规则确定目标题目区域,包括:
检测所述点击点和题目区域掩码的位置关系
如果所述点击点不落入任意的题目区域掩码内,则;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010495989.3/2.html,转载请声明来源钻瓜专利网。