[发明专利]一种文本检测模型的确定方法、装置及电子设备在审
申请号: | 202310644201.4 | 申请日: | 2023-06-01 |
公开(公告)号: | CN116665237A | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 陈永洒;王敏 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06V30/414 | 分类号: | G06V30/414;G06V30/14;G06V30/19 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王欢 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 检测 模型 确定 方法 装置 电子设备 | ||
本申请公开了一种文本检测模型的确定方法、装置及电子设备,该方法包括:获得初始文本检测模型针对待检测文本的第一检测结果,以及与待检测文本对应的第二检测结果;第二检测结果表征与待检测文本的真实标注结果;确定初始文本检测模型被应用时的应用特征;基于应用特征,分别确定与第一检测结果对应的第一应用结果,以及与第二检测结果对应的第二应用结果;基于第一应用结果和第二应用结果,确定与初始文本检测模型对应的目标文本检测模型。
技术领域
本申请涉及信息处理技术领域,更具体的说是涉及一种文本检测模型的确定方法、装置及电子设备。
背景技术
文本检测是文本处理领域的重要环节,随着深度学习技术的发展,利用机器学习模型来进行文本检测已成为普遍流行的方式。如何确保文本检测模型的准确性已成为文本处理领域主要面临的问题。
发明内容
有鉴于此,本申请提供如下技术方案:
一种文本检测模型的确定方法,包括:
获得初始文本检测模型针对待检测文本的第一检测结果,以及与所述待检测文本对应的第二检测结果;所述第二检测结果表征所述待检测文本的真实标注结果;
确定所述初始文本检测模型被应用时的应用特征;
基于所述应用特征,分别确定与所述第一检测结果对应的第一应用结果,以及与所述第二检测结果对应的第二应用结果;
基于所述第一应用结果和所述第二应用结果,确定与所述初始文本检测模型对应的目标文本检测模型。
可选地,所述确定所述初始文本检测模型被应用时的应用特征,包括:
确定针对所述初始文本检测模型的输出结果对应的目标识别模型,所述目标识别模型的输入为所述初始文本检测模型的输出结果;
确定与所述目标识别模型相匹配的应用特征。
可选地,所述目标识别模型为文本识别模型,其中,所述基于所述应用特征,分别确定与所述第一检测结果对应的第一应用结果,以及与所述第二检测结果对应的第二应用结果,包括:
基于所述文本识别模型对所述第一检测结果进行文本识别,得到第一识别字符串,将所述第一识别字符串确定为第一应用结果;
基于所述文本识别模型对所述第二检测结果进行文本识别,得到第二识别字符串,将所述第二识别字符串确定为第二应用结果。
可选地,所述第一检测结果包括第一文本检测框,所述第二检测结果包括第二文本检测框,其中,所述基于所述第一应用结果和所述第二应用结果,确定与所述初始文本检测模型对应的目标文本检测模型,包括:
若所述第一文本检测框与所述第二文本检测框满足目标匹配关系,基于所述第一识别字符串的第一长度和所述第二识别字符串的第二长度,确定匹配参数;
基于所述匹配参数,确定所述初始文本检测模型的评估参数;
基于所述评估参数,确定与所述初始文本检测模型对应的目标文本检测模型。
可选地,所述基于所述评估参数,确定与所述初始文本检测模型对应的目标文本检测模型,包括:
基于所述评估参数,确定惩罚对象;
确定与所述惩罚对象对应的惩罚比例,并基于所述惩罚比例对所述初始文本检测模型中与所述惩罚对象对应的权重进行调整,得到目标文本检测模型。
可选地,所述基于所述匹配参数,确定所述初始文本检测模型的评估参数,包括:
获得所述初始文本检测模型的评估指标阈值,所述评估指标阈值包括召回率阈值和/或准确率阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310644201.4/2.html,转载请声明来源钻瓜专利网。