[发明专利]模型识别结果定位方法和装置、电子设备、计算机介质在审
申请号: | 202110918846.3 | 申请日: | 2021-08-11 |
公开(公告)号: | CN115705733A | 公开(公告)日: | 2023-02-17 |
发明(设计)人: | 唐铭蔚;周柏村;王臣良;赵紫晗;田洪宝;付靖玲;裴积全 | 申请(专利权)人: | 京东科技信息技术有限公司 |
主分类号: | G06V30/32 | 分类号: | G06V30/32;G06V30/40;G06F40/126 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100176 北京市大兴区经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 识别 结果 定位 方法 装置 电子设备 计算机 介质 | ||
本公开提供了一种模型识别结果定位方法和装置,涉及图像识别、深度学习等技术领域。该方法的一具体实施方式包括:采用序列识别模型对文本行素材进行识别,得到序列识别模型输出的与文本行素材的文本行对应的编码序列;基于编码序列中各个编码的内容,检测是否需要更新编码的位置;响应于检测结果为需要更新编码的位置,基于编码在编码序列中的位置和序列识别模型,计算并存储编码的更新位置,更新位置为各个文本在文本行素材中的位置。该实施方式实现了对模型识别结果的定位。
技术领域
本公开涉及计算机技术领域,具体涉及图像识别、深度学习等技术领域,尤其涉及模型识别结果定位方法和装置、电子设备、计算机可读介质以及计算机程序产品。
背景技术
在CTC解码算法中,应用较多的解码算法是贪心搜索解码方法,贪心搜索解码方法可以对文字序列识别网络输出的文本序列的每一步选择概率最大的输出值,得到最终解码输出的文字序列。然而,由于文字序列识别网络无法对素材中各个文字实际的位置进行标注,无法得知贪心搜索解码方法是从素材的哪部分识别出的文本序列的各个文字。
发明内容
本公开的实施例提出了模型识别结果定位方法和装置、电子设备、计算机可读介质以及计算机程序产品。
第一方面,本公开的实施例提供了一种模型识别结果定位方法,该方法包括:采用序列识别模型对文本行素材进行识别,得到序列识别模型输出的与文本行素材的文本行对应的编码序列;基于编码序列中各个编码的内容,检测是否需要更新编码的位置;响应于检测结果为需要更新编码的位置,基于编码在编码序列中的位置和序列识别模型,计算并存储编码的更新位置,更新位置为各个文本在文本行素材中的位置。
在一些实施例中,基于编码序列中各个编码的内容,检测是否需要更新编码的位置,包括以下步骤:S1:检测编码序列中的当前编码的内容与当前编码相邻的上一个编码的内容是否相同;S2:响应于检测结果为当前编码的内容与当前编码相邻的上一个编码的内容不相同,确定需要更新当前编码的位置。
在一些实施例中,上述基于编码序列中各个编码的内容,检测是否需要更新编码的位置还包括:响应于检测结果为当前编码的内容与当前编码相邻的上一个编码的内容相同,将与当前编码相邻的下一个编码作为当前编码,继续执行步骤S1。
在一些实施例中,上述基于编码序列中各个编码的内容,检测是否需要更新编码的位置,还包括:检测编码序列中的当前编码的内容是否为预设的终止符号;响应于检测到当前编码的内容不是预设的终止符号时,将与当前编码相邻的下一个编码作为当前编码,继续执行步骤S1。
在一些实施例中,上述基于编码序列中各个编码的内容,检测是否需要更新编码的位置,还包括:检测编码序列中的当前编码的内容是否为预设的隔离标签;响应于检测结果为当前编码的内容是预设的隔离标签,将当前编码相邻的下一编码作为当前编码,继续执行步骤S1。
在一些实施例中,上述方法还包括:采用贪心搜索算法对编码序列进行预测,得到编码序列对应的文本序列;将文本序列中各个文本与各个更新位置一一对应设置。
在一些实施例中,上述基于编码在编码序列中的位置和序列识别模型,计算编码的更新位置,包括:将编码在编码序列中的位置输入位置更新公式,得到当前编码的更新位置;位置更新公式为:L=(i+0.5)*t/s;其中,L表示更新位置,t表示序列识别模型对图像宽度的压缩比例值,i表示当前编码在编码序列中的位置,s表示超参数。
在一些实施例中,上述序列识别模型包括:图像特征提取网络和文本序列提取网络;文本行素材包括:至少一个具有相同高度的文本行图像;上述采用序列识别模型对文本行素材进行识别,得到序列识别模型输出的与文本行素材的文本行对应的编码序列包括:将至少一个具有相同高度的文本行图像输入图像特征提取网络,得到各个文本行图像的图像特征向量序列;将各个图像特征向量序列输入文本序列提取网络,得到与文本行图像的文本行对应的编码序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技信息技术有限公司,未经京东科技信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110918846.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:远程合照方法、装置、设备及存储介质
- 下一篇:提拉胸贴