[发明专利]基于人工智能的目标识别方法、装置及存储介质有效
申请号: | 202011435671.2 | 申请日: | 2020-12-10 |
公开(公告)号: | CN112434715B | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 李星宇;岳大威;王宇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/44;G06V10/25;G06K9/62;G06N3/04 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;贾允 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 目标 识别 方法 装置 存储 介质 | ||
1.一种基于人工智能的目标识别方法,其特征在于,所述方法包括:
获取待识别图像;
提取所述待识别图像的综合局部位置信息和全局上下文信息,得到所述待识别图像对应的特征图组;
基于所述特征图组进行目标提取,得到目标提取结果,所述目标提取结果中的每个目标对应包括四个角点,并且以所述四个角点确定的四边形提取框框选所述目标;
若所述目标提取结果中包括至少一个嵌套结构,对所述嵌套结构的外层进行提取,得到第一提取框;以及,对所述嵌套结构的内层进行提取,得到至少一个第二提取框,所述第一提取框和所述第二提取框均为四边形提取框;
若所述第二提取框数量等于1,则得到所述第二提取框与第一提取框的交集,若所述交集与所述第二提取框的比值大于预设第一阈值,则删除目标提取框,得到处理结果,所述目标提取框为所述第二提取框与所述第一提取框中置信度较小的提取框;
若所述第二提取框数量大于1,则若各个相邻的第二提取框的重叠度小于预设第二阈值,并且各个第二提取框的并集与所述第一提取框的比值大于预设第三阈值,则删除所述第一提取框,得到所述处理结果;
根据所述处理结果,输出目标识别结果。
2.根据权利要求1所述的方法,其特征在于,所述基于所述特征图组进行目标提取,得到目标提取结果之后,所述方法还包括:
计算所述目标提取结果中各个四边形提取框的重叠度;
根据所述重叠度对所述目标提取结果进行过滤,得到过滤结果;
根据所述过滤结果,输出所述目标识别结果。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取训练样本集,对于所述训练样本集中的每个样本图像,所述样本图像中的每个标注目标均包括四个标注角点;
根据所述训练样本集训练目标提取网络,直至所述目标提取网络产生的损失小于损失阈值;所述目标提取网络包括依次连接的特征提取网络和目标预测网络;
其中,所述特征提取网络用于提取所述待识别图像的综合局部位置信息和全局上下文信息,得到所述待识别图像对应的特征图组;所述目标预测网络用于基于所述特征图组进行目标提取,得到目标提取结果,所述目标提取结果中的每个目标对应包括四个角点,并且以所述四个角点确定的四边形提取框框选所述目标。
4.根据权利要求3所述的方法,其特征在于,所述获取训练样本集,包括:
获取第一样本集,对于所述第一样本集中的每个第一样本图像,所述第一样本图像中的每个标注目标均包括四个标注角点;
对所述第一样本集中的至少一个第一样本图像进行图像增强,得到所述第一样本图像对应的至少一个第二样本图像;
根据所述第一样本图像集,以及各个第一样本图像对应的各个第二样本图像,生成所述训练样本集。
5.根据权利要求4所述的方法,其特征在于,所述根据所述训练样本集训练目标提取网络,包括:
将样本图像输入所述特征提取网络,得到所述样本图像对应的特征图组;
将所述特征图组输入所述目标预测网络,得到第一热力图组,所述第一热力图组包括每个目标的中心点热力图,以及所述每个目标对应的四个角点的热力图;
根据所述样本图像得到第二热力图组,所述第二热力图组包括每个标注目标的中心点热力图,以及所述每个标注目标的四个角点的热力图;
根据所述第一热力图组和所述第二热力图组,计算损失值;
若所述损失值大于等于所述损失阈值,则反馈调节所述目标提取网络的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011435671.2/1.html,转载请声明来源钻瓜专利网。