[发明专利]基于图像的目标点位置检测方法、装置、电子设备有效
申请号: | 201910185907.2 | 申请日: | 2019-03-12 |
公开(公告)号: | CN110069985B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 柴振华;赖申其 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图像 目标 位置 检测 方法 装置 电子设备 | ||
本申请公开了一种基于图像的目标点位置检测方法,属于计算机技术领域,用于目标点位置检测性能低下的问题。本申请实施例中公开的点位置检测方法包括:获取标注有真实目标点位置的若干图像样本;通过所述神经网络模型的损失函数根据变量计算所述神经网络模型的损失值,并以所述损失值最小为目标调整所述神经网络模型的参数,训练所述神经网络模型;其中,所述损失函数被配置为相对于变量的绝对值单调递增,所述损失函数对应的梯度函数为单调递减函数且所述梯度函数的值大于1并在所述变量趋近于无穷大时逐渐趋近于1;所述变量用于表示真实值和预测值之间的差值,所述真实值基于样本标签确定,所述预测值通过所述神经网络模型预测得到。
技术领域
本申请涉及图像识别和检测技术领域,特别是涉及一种基于图像的目标点位置检测方法、装置、电子设备及存储介质。
背景技术
基于图像的目标点位置检测具有广泛的应用,如基于人脸图像的人脸关键点检测,基于视频图像的行人检测。以人脸检测为例,人脸检测是人脸识别、人脸美妆、人脸贴图等产品的核心技术。基于人脸图像中检测到的人脸关键点,可以开发出很多应用。随着人们对深度学习研究的不断深入,通过深度学习方法进行基于图像的目标点位置检测的研究不断展开,并取得了一定效果。通常的目标点位置检测任务是回归任务,由神经网络模型的损失函数基于欧式距离进行误差的前向和后向传播。然而,基于欧式距离的损失函数,有一个众所周知的缺点,那就是对“离群点”敏感,即当某个点的预测值与真实值误差较大时,整个loss(损失值)将由这个点所“主导”。为了避免预测值与真实值误差较大时,网络模型的损失函数的函数值过大,现有技术中出现了一种人脸关键点检测方法,通过采用Wing loss损失函数,在进行网络模型优化过程中,针对误差更小处给予更大梯度,而误差较大处梯度为适中,取得了更好的结果。
然而,由于Wing loss的目标函数是分段函数,在代码实现的时候对forward(前向传播)和backward(后向传播)两个过程需要分别进行处理,实现比较复杂。并且,有两个超参数需要调节,且不同场景下两个超参数的最优值差异很大,导致模型的训练过程复杂,训练效率低下,并且模型的准确度较低。
可见,现有技术中的目标点位置检测方法至少存在性能低下的缺陷。
发明内容
本申请实施例提供一种基于图像的目标点位置检测方法,有助于改善目标点位置检测性能低下的问题。
为了解决上述问题,第一方面,本申请实施例提供了一种基于图像目标点位置检测方法,包括:
获取标注有真实目标点位置的若干图像样本;
通过所述神经网络模型的损失函数根据变量计算所述神经网络模型的损失值,并以所述损失值最小为目标调整所述神经网络模型的参数,训练所述神经网络模型;其中,所述损失函数被配置为相对于变量的绝对值单调递增,所述损失函数对应的梯度函数为单调递减函数且所述梯度函数的值大于1并在所述变量趋近于无穷大时逐渐趋近于1;所述变量用于表示真实值和预测值之间的差值,所述真实值基于标注的所述真实目标点位置确定,所述预测值通过所述神经网络模型对所述各所述图像样本进行预测得到;
通过训练得到的所述神经网络模型,对输入的图像进行目标点位置检测。
第二方面,本申请实施例提供了一种基于图像的目标点位置检测装置,包括:
图像样本获取模块,用于获取标注有真实目标点位置的若干图像样本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910185907.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序