[发明专利]基于深度学习的题目分割方法、装置、设备和介质在审
申请号: | 202010495987.4 | 申请日: | 2020-06-03 |
公开(公告)号: | CN111652142A | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 张亚龙;邓小兵;张春雨 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/34;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州智斧知识产权代理事务所(普通合伙) 44649 | 代理人: | 孔德超 |
地址: | 528850 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 题目 分割 方法 装置 设备 介质 | ||
1.一种基于深度学习的题目分割方法,其特征在于,包括:
创建并训练基于深度学习的实例分割模型;
获取输入图像,并对所述输入图像进行切分,形成目标图片;
将所述目标图片输入所述实例分割模型,输出一个或多个包裹题目的多边形框坐标。
2.根据权利要求1所述的题目分割方法,其特征在于,创建并训练基于深度学习的实例分割模型,包括:
创建基于深度学习的实例分割初始模型,所述实例分割初始模型包括特征提取网络、区域候选网络、回归网络以及分割网络;
确定样本集并对所述样本集中每个样本图像绘制多边形包围框,每个多边形包围框包裹一个题目;
将每个样本图像分别输入所述实例分割初始模型中,通过反向传播算法对所述实例分割初始模型进行迭代训练,以调整实例分割初始模型的模型参数使得损失函数趋于收敛或小于第一预设阈值,最终得到训练后的实例分割模型。
3.根据权利要求2所述的题目分割方法,其特征在于,将所述目标图片输入所述实例分割模型,输出一个或多个包裹题目的多边形框坐标,包括:
利用所述特征提取网络提取所述目标图片的特征图;
将所述特征图输入区域候选网络,生成候选边界框;
利用所述回归网络对所述候选边界框进行分类和边框回归,得到初始预测边界框;
通过非极大值抑制算法对所述初始预测边界框进行过滤,得到最终预测边界框;
将所述最终预测边界框输入分割网络中,输出每个最终预测边界框对应的多边形框坐标。
4.根据权利要求3所述的题目分割方法,其特征在于,所述将所述特征图输入区域候选网络,生成候选边界框,包括:
利用设定大小的矩形框,采用所述矩形框不同的设定长宽比缩放滑动窗口,滑动窗口在所述特征图上滑动,对边界框进行预测,并将预测的矩形框映射到目标图片中,形成所述候选边界框;
利用所述回归网络对所述候选边界框进行分类和边框回归,得到初始预测边界框,包括:
利用回归网络中的分类分支预测所述候选边界框的分类得分,并滤除所述分类得分小于第二预设阈值的候选边界框;
利用回归网络的回归分支对保留的候选边界框进行平移变换或/和尺度缩放变换,得到初始预测边界框。
5.根据权利要求1-4任一项所述的题目分割方法,其特征在于,所述对所述输入图像进行切分,形成目标图片,包括:
识别输入图像中长和高的像素点数,根据所述像素点数和预设规则对所述输入图像进行切分,得到一个或多个目标图片。
6.一种基于深度学习的题目分割装置,其特征在于,包括:
创建单元,用于创建并训练基于深度学习的实例分割模型;
切分单元,用于获取输入图像,并对所述输入图像进行切分,形成目标图片;
识别单元,用于将所述目标图片输入所述实例分割模型,输出一个或多个包裹题目的多边形框坐标。
7.根据权利要求6所述的题目分割装置,其特征在于,所述创建单元,包括:
构建子单元,用于创建基于深度学习的实例分割初始模型,所述实例分割初始模型包括特征提取网络、区域候选网络、回归网络以及分割网络;
样本子单元,用于确定样本集并对所述样本集中每个样本图像绘制多边形包围框,每个多边形包围框包裹一个题目;
训练子单元,用于将每个样本图像分别输入所述实例分割初始模型中,通过反向传播算法对所述实例分割初始模型进行迭代训练,以调整实例分割初始模型的模型参数使得损失函数趋于收敛或小于第一预设阈值,最终得到训练后的实例分割模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010495987.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便于维修的开闭所
- 下一篇:一种联轴器的热装工具及方法