[发明专利]一种训练物体检测模型的方法、装置以及设备有效
申请号: | 201811070244.1 | 申请日: | 2018-09-13 |
公开(公告)号: | CN110796154B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 张长征;金鑫;涂丹丹 | 申请(专利权)人: | 华为云计算技术有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 刘丽萍 |
地址: | 550025 贵州省贵阳市*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 训练 物体 检测 模型 方法 装置 以及 设备 | ||
本申请公开了一种计算设备执行的训练物体检测模型的方法。该方法将第一阶段训练完毕后的分类器复制成至少两个,在第二阶段的训练中,复制出的每个分类器用于检测尺寸不同的待检测物体,并根据检测结果对物体检测模型进行训练。该方法通过两阶段的训练态获得的物体检测模型对待检测物体的检测准确度更高。
技术领域
本申请涉及计算机技术领域,尤其涉及训练物体检测模型的方法,和用于执行该方法的装置和计算设备。
背景技术
物体检测是一项对图像/视频中的物体进行准确定位并进行分类检测的人工智能技术,其包含通用物体检测、人脸检测、行人检测、文字检测等诸多细分领域。近年来,学术界与工业界积极投入,算法不断成熟,当前基于深度学习的物体检测方案被用在市政安防(行人检测、车辆检测、车牌检测等)、金融(物体检测、刷脸登录等)、互联网(身份验证)、智能终端等实际产品中。
目前物体检测已经较广泛应用于多种简单/中等复杂难度场景(比如门禁、卡口场景下检测人脸)。在开放环境下,如何保持训练出的物体检测模型对待检测物体的尺寸变化幅度较大、遮挡、扭曲等多种不利因素的鲁棒性,并提升检测精度,仍是一个待解决的问题。
发明内容
本申请提供了一种训练物体检测模型的方法,该方法提升了训练出的物体检测模型的检测精度。
第一方面,提供了一种计算设备执行的物体检测模型的训练方法,执行该方法的计算设备可以是分布在相同或不同环境中的一台或多台计算设备。该方法包括:
获取训练图像,根据所述训练图像建立主干网络。
将所述主干网络输出的特征图输入区域提议网络。
所述区域提议网络根据区域提议参数从所述主干网络输出的特征图中选取多个提议区域,将所述多个提议区域对应的子特征图输入分类器。
所述分类器根据所述多个提议区域对应的子特征图检测所述训练图像中的待检测物体。
对比所述分类器检测出的所述训练图像中的待检测物体和所述训练图像的先验结果,根据所述对比结果对所述主干网络的卷积核的模型参数、所述区域提议网络的卷积核的模型参数、所述区域提议参数、所述分类器的参数中的至少一个进行激励。
复制所述分类器,获得至少两个分类器。
所述区域提议网络将所述多个提议区域划分为至少两个提议区域集合,每个提议区域集合包括至少一个提议区域。
所述区域提议网络将每个提议区域集合包括的提议区域对应的子特征图输入所述至少两个分类器中的一个分类器。
所述至少两个分类器中的每个分类器执行以下动作:根据获取的提议区域集合包括的提议区域对应的子特征图检测所述训练图像中的待检测物体;对比检测出的所述训练图像中的待检测物体和所述训练图像的先验结果,根据所述对比结果对所述主干网络的卷积核的模型参数、所述区域提议网络的卷积核的模型参数、所述区域提议参数、所述每个分类器的参数中的至少一个进行激励。
所述至少两个分类器中的每个分类器根据所述对比结果对自身的参数进行激励,一般不根据所述对比结果对所述至少两个分类器中的其他分类器的参数进行激励。
以上提供的方法,将训练图像两次输入物体检测模型,以对物体检测模型进行训练。第一阶段的训练中,不对待检测物体的尺寸进行区分,使得训练出的分类器具有全局观。第二阶段的训练中,复制出的每个分类器负责检测一个提议区域集合内的待检测物体,即负责检测一类尺寸的待检测物体,使得训练出的每个分类器进一步的有针对性的对不同尺寸的待检测物体更加敏感。两阶段的训练,提升了训练出的物体检测模型对于不同尺寸的待检测物体的检测精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为云计算技术有限公司,未经华为云计算技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811070244.1/2.html,转载请声明来源钻瓜专利网。