[发明专利]特征图的处理方法和相关设备在审
申请号: | 202110740186.4 | 申请日: | 2021-06-30 |
公开(公告)号: | CN115564962A | 公开(公告)日: | 2023-01-03 |
发明(设计)人: | 赵寅;毛珏;杨海涛 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;李稷芳 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 处理 方法 相关 设备 | ||
1.一种特征图的处理方法,其特征在于,所述方法通过调用神经网络模型实现,所述神经网络模型包括多个输入适配分支和后处理部分,所述多个输入适配分支的输出为所述后处理部分的输入,所述多个输入适配分支用于对特征图进行下采样,所述多个输入适配分支中的每个输入适配分支对特征图的下采样倍率不同;所述方法包括:
将第一特征图输入所述多个输入适配分支中的其中一个输入适配分支,以得到第二特征图,所述其中一个输入适配分支是根据所述第一特征图的尺寸和预设尺寸阈值确定的,所述预设尺寸阈值为所述后处理部分的输入特征图的上限尺寸,所述第二特征图的尺寸不大于所述预设尺寸阈值;
将所述第二特征图输入所述后处理部分进行后处理,以得到所述第一特征图的处理结果。
2.根据权利要求1所述的方法,其特征在于,所述多个输入适配分支中对特征图的下采样倍率为整数倍的任一第一输入适配分支包括至少一个第一卷积层,所述至少一个第一卷积层用于对特征图进行下采样,所述至少一个第一卷积层的步长是根据所述任一第一输入适配分支对特征图的下采样倍率确定的。
3.根据权利要求1所述的方法,其特征在于,所述多个输入适配分支中对特征图的下采样倍率为非整数倍的任一第二输入适配分支包括至少一个上采样模块和至少一个第二卷积层,所述至少一个上采样模块用于对特征图进行上采样,所述至少一个第二卷积层用于对所述上采样得到的特征图进行下采样,所述至少一个上采样模块对特征图的上采样倍率以及所述至少一个第二卷积层的步长是根据所述任一第二输入适配分支对特征图的下采样倍率确定的。
4.根据权利要求1所述的方法,其特征在于,所述多个输入适配分支中对特征图的下采样倍率大于1的任一第三输入适配分支包括至少一个残差块结构(Resblock),所述至少一个残差块结构用于对特征图进行下采样,所述至少一个残差块结构包括多个第三卷积层,所述多个第三卷积层中的任一第三卷积层的步长是根据所述任一第三输入适配分支对特征图的下采样倍率确定的。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述其中一个输入适配分支是根据第一比值和第二比值中的最大值确定的,所述第一比值为所述第一特征图的宽和所述预设尺寸阈值的宽之间的比值,所述第二比值为所述第一特征图的高和所述预设尺寸阈值的高之间的比值。
6.根据权利要求1-5任一项所述的方法,其特征在于,若所述第二特征图的尺寸大于所述预设尺寸阈值,所述方法还包括:
从所述第二特征图中截取得到第三特征图,所述第三特征图的尺寸不大于所述预设尺寸阈值;
将所述第三特征图输入所述后处理部分进行后处理,以得到所述第一特征图的处理结果。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述第一特征图为解码码流得到的特征图。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述方法还包括:
根据训练样本集对所述神经网络模型进行N轮训练,以得到N个第一损失值,所述训练样本集包括至少N种尺寸的样本特征图,所述N不小于所述多个输入适配分支的数量,所述N为整数;
根据所述N个第一损失值得到第二损失值;
根据所述第二损失值更新所述神经网络模型的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110740186.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种调节血糖代谢的食物组合物
- 下一篇:一种缓解疲劳的眼部按摩方法