[发明专利]基于拆分-融合策略的分布式深度神经网络结构转换方法有效

专利信息
申请号: 202110462461.0 申请日: 2021-04-27
公开(公告)号: CN113255730B 公开(公告)日: 2023-04-07
发明(设计)人: 刘龙军;郑谊焕;侯文轩;张昊楠;李英翔;孙宏滨;郑南宁 申请(专利权)人: 西安交通大学
主分类号: G06V10/80 分类号: G06V10/80;G06V10/82;G06N3/0464;G06N3/08;G06N3/12
代理公司: 西安通大专利代理有限责任公司 61200 代理人: 安彦彦
地址: 710049 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 拆分 融合 策略 分布式 深度 神经网络 结构 转换 方法
【说明书】:

基于拆分‑融合策略的分布式深度神经网络结构转换方法,采集图片,组成数据集,并将数据集分为训练集和测试集,对训练集和测试集中的图片进行预处理;对网络模型进行通道拆分,扩充网络模型宽度,然后再添加融合层,得到改进后的网络模型;采用训练集中的图片对改进后的网络模型进行训练后,将预处理之后的测试集中的图片输入到训练后的网络模型中,得到图片分类结果。本发明针对分布式推理的场景对已有的用于图片分类任务的网络模型进行改进,转换之后的网络模型可以在资源受限的分布式系统中实现较快的推理速度,即可以在资源受限的分布式系统中执行图片分类任务,并较快地得到分类结果,并且图片具有更高的分类精度。

技术领域

本发明属于人工智能技术领域,涉及一种基于拆分-融合策略的分布式深度神经网络结构转换方法,可以将现有的图像分类的网络模型转换为适用于分布式系统的网络模型,以在资源受限的分布式系统上执行图像分类任务,也可用于目标检测、语义分割等其他计算机视觉任务中。

背景技术

卷积神经网络目前已经成为了图片分类任务的主流方法,在CIFAR10、ImageNet等多个图片分类数据集中取得了当前最佳的精度。为了能使该技术得到更广泛的应用,将网络模型部署到嵌入式和移动设备等硬件中是必须的。但主流的卷积神经网络模型通常十分巨大,如VGG16的参数量高达138M,现有的硬件根本无法推理如此大的网络。针对这些硬件,一些轻量化的网络结构被通过手工设计或自动结构搜索的方法提出,如mobilenet系列,shufflenet系列,ghostnet,proxylessnas等,这些轻量化的网络模型以深度卷积(depthwise convolution)为核心操作,在保持参数量和计算量相对较少的同时,仍然能够达到较高的精度,因而受到了人们的青睐。

但是,这些网络模型都是针对单个硬件设计的,随着物联网(IoT)技术的迅猛发展,边缘计算成为了最近的一个研究热点和难点,在分布式系统中部署网络模型逐渐成为了一个广泛的需求,与在单个硬件上部署网络相比,在分布式系统中部署网络模型更加地困难,主要的原因有两点:(1)一个分布式系统通常包含很多边缘设备,单个边缘节点的计算能力通常非常弱,甚至连一个轻量化网络模型的推理都无法完成。(2)不同边缘节点之间的通信会产生额外的开销。

理论上说,直接将网络模型部署到分布式系统中,令不同的边缘节点推理不同的通道,是完全可以实现的。但是这种做法会带来巨大的通信开销,并严重拖慢系统的推理速度。这些额外的通信开销是由网络模型中的标准卷积(Standard convolution)层带来的,标准卷积的计算特性决定了其每一个输出通道都依赖于所有的输入通道,因此在推理每一个标准卷积层时,分布式系统的任意两个节点之间都需要通信。

为了避免额外的通信开销,可以将网络模型中的卷积层全部转换成组卷积,令不同的节点推理不同的组,这样做每个节点所有的输出通道只依赖于该节点的输入通道,不同节点之间不再需要任何的通信。但是这样做会带来新的问题。在整个前向推理的过程中,网络模型中不同的组之间没有信息交流,即出现了“信息阻塞”现象,严重地影响网络的精度。

现有的分布式推理方案(Deepthings,Fully Deepthings)的并行策略是对网络模型中每一层的特征图进行了分割,令不同的节点推理特征图的不同区域,但是这种策略在分布式系统上执行卷积神经网络的图片分类任务的推理时,仍然会带来很大的额外开销(通信开销或计算开销),该部分额外开销会严重地拉长推理时间(得到分类结果所需的时间),对需要快速得到分类结果的场合影响巨大。

现有技术中对图片分类存在精度低的问题。

发明内容

为克服现有技术中的问题,本发明的目的是提供一种基于拆分-融合策略的分布式深度神经网络模型转换方法。

为实现上述方法,本发明采用的技术方案如下:

基于拆分-融合策略的分布式深度神经网络结构转换方法,包括以下步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110462461.0/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top