[发明专利]属性值预测方法、装置、计算机系统和可读存储介质在审
申请号: | 202110166460.1 | 申请日: | 2021-02-05 |
公开(公告)号: | CN113762316A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 周彬 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06Q30/06 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 孙蕾 |
地址: | 100176 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 属性 预测 方法 装置 计算机系统 可读 存储 介质 | ||
1.一种属性值预测方法,包括:
获取至少两个特征图,其中,所述至少两个特征图是将待处理图像输入预训练模型后,利用所述预训练模型中的至少两个特征提取层提取得到的,所述待处理图像中包括待预测属性;
将所述至少两个特征图中每个特征图的输出尺寸调整至目标尺寸;
采用预设拼接规则对具有所述目标尺寸的至少两个特征图进行拼接,得到最终特征图;以及
对所述最终特征图进行处理,得到所述待处理图像的一个属性值。
2.根据权利要求1所述的方法,其中,所述目标尺寸包括目标长、目标宽和目标通道数量,将所述至少两个特征图中每个特征图的输出尺寸调整至目标尺寸包括:
在所述特征图的长与所述目标长、以及所述特征图的宽与所述目标宽都不一致的情况下,通过上采样的方式将所述特征图的长调整至所述目标长,将所述特征图的宽调整至所述目标宽;以及
在所述特征图的通道数量与所述目标通道数量不一致的情况下,通过卷积的方式将所述特征图的通道数量调整至所述目标通道数量。
3.根据权利要求1所述的方法,其中,所述至少两个特征图包括第一特征图、第二特征图和第三特征图,采用预设拼接规则对具有所述目标尺寸的至少两个特征图进行拼接,得到最终特征图包括:
基于注意力机制对所述第一特征图和所述第二特征图进行拼接,得到拼接特征图;以及
基于注意力机制对所述拼接特征图和所述第三特征图进行拼接,得到所述最终特征图。
4.根据权利要求1所述的方法,还包括:
在将所述待处理图像输入至所述预训练模型之前,对所述待处理图像进行图像预处理,包括:
确定所述属性值预测模型针对待处理图像的输入尺寸的预设标准;
在所述待处理图像的尺寸不符合所述预设标准的情况下,保持所述待处理图像的长宽比例不变,对所述待处理图像的边缘补充像素,以使得补充像素后的待处理图像的尺寸符合所述预设标准。
5.根据权利要求1所述的方法,其中,所述属性值预测方法通过属性值预测模型实现,所述属性值预测模型包括所述预训练模型,所述方法还包括:
在所述待预测属性包括多个的情况下,获取包括多个所述属性值预测模型的总预测模型;
通过所述总预测模型中的每个所述属性值预测模型分别对每个所述待预测属性进行预测,得到所述待处理图像的多个属性值;以及
根据所述多个属性值确定所述待处理图像的目标属性值。
6.根据权利要求1所述的方法,其中,所述属性值预测模型是通过迭代训练的方式进行训练的,每次迭代包括:
获取图像训练集,其中,所述图像训练集中包括多个图像和每个所述图像对应的基础属性值;
将所述图像训练集输入至属性值训练模型,得到针对所述图像训练集中每个图像的第一预测属性值;
根据所述第一预测属性值和所述基础属性值调整所述属性值预测模型的损失函数,得到下一次迭代的属性值训练模型;
将所述图像训练集输入至所述下一次迭代的属性值训练模型,得到针对所述图像训练集中每个图像的第二预测属性值;
在所述第二预测属性值和所述基础属性值不匹配的情况下,从所述图像训练集中删除不匹配的属性值所对应的图像,得到下一次迭代的图像训练集。
7.根据权利要求1所述的方法,其中,所述待处理图像中包括已配置属性值,所述已配置属性值为所述待预测属性在所述待处理图像中的实际配置值,所述方法还包括:
获取通过所述属性值预测模型预测得到的针对所述待处理图像的预测属性值;以及
在所述预测属性值和所述已配置属性值不匹配的情况下,对所述待处理图像进行标记。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110166460.1/1.html,转载请声明来源钻瓜专利网。