[发明专利]一种用基于张量的卷积网络提取高维特征的方法有效
申请号: | 201810049756.3 | 申请日: | 2018-01-18 |
公开(公告)号: | CN108154194B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 施云惠;崔应炫;丁文鹏;尹宝才 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 张量 卷积 网络 提取 特征 方法 | ||
1.一种用基于张量的卷积网络提取高维特征的方法,建立基于张量的卷积网络:卷积网络核心部分是分离-融合模块,而分离-融合模块则由可分离卷积组件和特征融合组件构成,其中,可分离卷积组件包括多个可分离卷积层组成,特征融合组件包括一个多维卷积核;整个基于张量的N维卷积模型由多个N维分离-融合模块、池化层和全连接层组成;
首先卷积层参数初始化,当输入N维信号时,在经过每个分离-融合模块时,N维信号先按张量展开操作展开成N组二维矩阵,每组二维矩阵输入到一个可分离卷积层中,各自执行一系列的一维卷积操作,将所得到的每组二维特征矩阵通过张量折叠操作折叠成一组N阶特征张量,那么每个可分离卷积层输出一组N阶特征张量,每个分离模块就输出N组N阶特征张量,这些N阶张量按照通道数级联起来,输入到融合模块中,经过一个N维的且每个维度的大小为1的卷积核做卷积运算,最终这个分离-融合模块输出一组N阶张量,接着将它们输入到每个维度感受野为2的N维最大池化层中进行下采样,输出一组每个维度大小减半的N阶张量,接着这组N阶张量作为新的N维信号输入到下一个分离-融合模块和最大池化层中,经过若干个这样的操作之后,操作次数与网络模型中所设置的分离-融合模块的个数相同;最后一个最大池化层输出的一组N阶张量通过向量化的操作转成一个向量输入到全连接层中,最终输出一个识别分类的概率向量;
其特征在于:当处理三维视频信号时,这里要选用基于张量的三维卷积模型,设定模型有3个分离-融合模块和3个最大池化层以及一个全连接层,所输入的三维视频信号依次经过分离-融合模块1、最大池化层1、分离-融合模块2、最大池化层2、分离-融合模块3、最大池化层3、全连接层,三维视频信号每经过一个最大池化层 就得到一组分辨率减半的三维视频信号,这样,最大池化层3就输出一组分辨率为输入信号的1/8的三维视频信号,这些信号经过向量化之后,输入到全连接层,最终模型输出该三维视频信号的识别分类概率向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810049756.3/1.html,转载请声明来源钻瓜专利网。