[发明专利]一种对象识别方法、装置及电子设备有效
申请号: | 202110734210.3 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113537309B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 余威;王昆 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V10/74 | 分类号: | G06V10/74;G06V10/80;G06V10/46;G06V10/50;G06V10/82;G06N3/0464;G06F16/583;G06F16/587 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;丁芸 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 对象 识别 方法 装置 电子设备 | ||
1.一种对象识别方法,包括:
获取待检测对象的位置信息及图像数据;
对所述待检测对象的位置信息及图像数据进行特征提取,得到第一目标拼接特征,其中,所述第一目标拼接特征中包括所述待检测对象的位置信息的特征及图像数据的特征;
将所述第一目标拼接特征输入到预先训练的深度学习模型中,得到第二目标拼接特征;
将所述第二目标拼接特征与各第二样本拼接特征进行匹配,得到与所述第二目标拼接特征匹配的第二样本拼接特征,其中,所述第二样本拼接特征是利用所述深度学习模型对样本对象的第一样本拼接特征进行处理得到的;
判定所述待检测对象为与所述第二目标拼接特征匹配的第二样本拼接特征所对应的样本对象。
2.根据权利要求1所述的方法,其中,所述对所述待检测对象的位置信息及图像数据进行特征提取,得到第一目标拼接特征,包括:
对所述待检测对象的图像数据进行特征提取,得到目标图像特征;
对所述待检测对象的位置信息进行特征编码,得到目标位置特征;
对所述目标图像特征与所述目标位置特征拼接,得到第一目标拼接特征。
3.根据权利要求1所述的方法,其中,所述将所述第二目标拼接特征与各第二样本拼接特征进行匹配,得到与所述第二目标拼接特征匹配的第二样本拼接特征,包括:
利用预设人工神经网络将所述第二目标拼接特征与多个第二样本拼接特征并行匹配,得到与所述第二目标拼接特征匹配的第二样本拼接特征。
4.根据权利要求1所述的方法,其中,所述深度学习模型的训练过程包括:
获取多个样本对,其中,所述样本对包括多个第一类负样本对、多个第二类负样本对及多个正样本对,所述第一类负样本对包括两个品牌相同、且距离大于预设距离阈值的样本对象的第一样本拼接特征;所述第二类负样本对包括两个品牌不同、且距离小于预设距离阈值的样本对象的第一样本拼接特征;所述正样本对包括两个品牌相同、且距离小于预设距离阈值的样本对象的第一样本拼接特征;
选取一样本对,将该样本对中的两个第一样本拼接特征分别输入到深度学习模型中进行处理,得到该样本对对应的两个第二样本拼接特征;
基于该样本对对应的两个第二样本拼接特征的相似性计算模型的损失,并根据当前的损失调整深度学习模型的训练参数,其中,针对第一类负样本对及第二类负样本对,其对应的两个第二样本拼接特征的相似性越高模型的损失越大,针对正样本对,其对应的两个第二样本拼接特征的相似性越高模型的损失越小;
判断是否满足预设结束条件,若否则返回步骤:选取一样本对,将该样本对中的两个第一样本拼接特征分别输入到深度学习模型中进行处理,得到该样本对对应的两个第二样本拼接特征,继续执行;若是则得到训练好的深度学习模型。
5.一种对象识别装置,包括:
对象信息获取模块,用于获取待检测对象的位置信息及图像数据;
拼接特征提取模块,用于对所述待检测对象的位置信息及图像数据进行特征提取,得到第一目标拼接特征,其中,所述第一目标拼接特征中包括所述待检测对象的位置信息的特征及图像数据的特征;
拼接特征转换模块,用于将所述第一目标拼接特征输入到预先训练的深度学习模型中,得到第二目标拼接特征;
拼接特征匹配模块,用于将所述第二目标拼接特征与各第二样本拼接特征进行匹配,得到与所述第二目标拼接特征匹配的第二样本拼接特征,其中,所述第二样本拼接特征是利用所述深度学习模型对样本对象的第一样本拼接特征进行处理得到的;
对象识别模块,用于判定所述待检测对象为与所述第二目标拼接特征匹配的第二样本拼接特征所对应的样本对象。
6.根据权利要求5所述的装置,其中,所述拼接特征提取模块,具体用于:
对所述待检测对象的图像数据进行特征提取,得到目标图像特征;
对所述待检测对象的位置信息进行特征编码,得到目标位置特征;
对所述目标图像特征与所述目标位置特征拼接,得到第一目标拼接特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110734210.3/1.html,转载请声明来源钻瓜专利网。