[发明专利]一种表格检测方法、装置、设备以及存储介质有效
申请号: | 202110923843.9 | 申请日: | 2021-08-12 |
公开(公告)号: | CN113627350B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 周侠;王乐义;李乔伊;秦铎浩;刘明浩 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V30/148;G06N20/00 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;丁芸 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 表格 检测 方法 装置 设备 以及 存储 介质 | ||
1.一种表格检测方法,包括:
获取待处理图像;
将所述待处理图像输入预先训练好的深度学习模型,通过所述深度学习模型输出全表检测分支结果、列检测分支结果和表头检测分支结果;所述全表检测分支结果表示针对所述待处理图像中全表的检测结果,所述列检测分支结果表示针对所述待处理图像中表格中列的检测结果,所述表头检测分支结果表示针对所述待处理图像中表头的检测结果;
基于所述全表检测分支结果、列检测分支结果和表头检测分支结果,得到所述待处理图像中表格的检测结果;
所述基于所述全表检测分支结果、列检测分支结果和表头检测分支结果,得到所述待处理图像中表格的检测结果,包括:
对所述全表检测分支结果、列检测分支结果和表头检测分支结果进行叠加;
对叠加得到的结果拟合边界范围,得到所述待处理图像中针对表格的检测框;
所述全表检测分支结果包括全表检测分支二值图,所述全表检测分支二值图表示所述待处理图像中各个像素点是否属于全表;所述列检测分支结果包括列检测分支二值图,所述列检测分支二值图表示所述待处理图像中各个像素点是否属于表格中的列;所述表头检测分支结果包括表头检测分支二值图,所述表头检测分支二值图表示所述待处理图像中各个像素点是否属于表头;
所述对所述全表检测分支结果、列检测分支结果和表头检测分支结果进行叠加,包括:
对所述全表检测分支二值图、所述列检测分支二值图和所述表头检测分支二值图求取并集,得到并集二值图;
所述对叠加得到的结果拟合边界范围,得到所述待处理图像中针对表格的检测框,包括:
确定所述并集二值图中的连通区域;
确定所述连通区域的外接矩形,所述外接矩形为所述待处理图像中针对表格的检测框。
2.根据权利要求1所述的方法,所述方法还包括:
获取多个样本图像以及各个样本图像中标注的表格的全表、标注的列和标注的表头;
针对各个样本图像,将所述样本图像输入初始模型;
通过所述初始模型对所述样本图像进行特征提取;
将特征提取的结果分别输入全表检测分支、列检测分支和表头检测分支,得到样本全表检测分支结果、样本列检测分支结果和样本表头检测分支结果;
利用所述样本全表检测分支结果、所述样本列检测分支结果和所述样本表头检测分支结果,以及标注的表格的全表、标注的列和标注的表头对所述初始模型进行训练,得到深度学习模型。
3.根据权利要求2所述的方法,其中,所述利用所述样本全表检测分支结果、所述样本列检测分支结果和所述样本表头检测分支结果,以及标注的表格的全表、标注的列和标注的表头对所述初始模型进行训练,得到深度学习模型,包括:
利用所述样本全表检测分支结果和所述标注的表格的全表,通过第一损失函数,计算第一损失函数值;
利用所述样本列检测分支结果和所述标注的列,通过第二损失函数,计算第二损失函数值;
利用所述样本表头检测分支结果和所述标注的表头,通过第三损失函数,计算第三损失函数值;
将所述第一损失函数值、所述第二损失函数值和所述第三损失函数值求和,得到总函数值;
基于所述总函数值对所述初始模型进行训练,得到深度学习模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110923843.9/1.html,转载请声明来源钻瓜专利网。