[发明专利]一种基于LSTM的二维图像的目标类别判识方法有效
申请号: | 201711071551.7 | 申请日: | 2017-11-03 |
公开(公告)号: | CN107748899B | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 徐勇;吴帅 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市添源知识产权代理事务所(普通合伙) 44451 | 代理人: | 罗志伟 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 lstm 二维 图像 目标 类别 方法 | ||
1.一种基于LSTM的二维图像的目标类别判识方法,其特征在于,包括以下步骤:
S1、依照从外至内的环状串联的方式将二维图像转化为一维矢量,依照行序串联的方式将二维图像转化为一维矢量,依照从列序串联的方式将二维图像转化为一维矢量;
S2、将上述三种转化方式所得到的一维矢量全部送入LSTM网络进行训练或者判识,然后输出三种结果;
S3、将LSTM网络输出的三种结果进行融合,并基于最终的融合结果进行目标判识;
其中,
在步骤S3中,采用加权得分融合的方式对不同序列LSTM的得分结果进行融合;
对于一个待分类样本,认为与待分类样本最接近的那个类别的得分与其他得分的差异越大,分类结果就越可靠,相应的权重值也越大;
采用分类应用,对第一个转化方式得到的序列,假设得到的与待分类样本最相似的类别的得分为d1,与待分类样本次相似的类别的得分为d2,则第一个转化方式的分类结果的可靠度设置为w1=|d1-d2|;对第二个转化方式得到的序列,假设得到的与待分类样本最相似的类别的得分为e1,与待分类样本次相似的类别的得分为e2,则第二个转化方式的分类结果的可靠度设置为w2=|e1-e2|;对于第三种方式转化的序,假设得到的与待分类样本最相似的类别的得分为f1,与待分类样本次相似的类别的得分为f2,则第三个转化方式的分类结果的可靠度设置为w3=|f1-f2|;第一、第二、第三个转化方式的分类结果的权重分别设定为r1=w1/(w1+w2+w3),r2=w2/(w1+w2+w3),r3=w3/(w1+w2+w3);以这三个权重作为加和第一、第二、第三个转化方式的分类结果的系数,最后依据得到的加和结果对目标进行类别判识;假如第一个转化方式得出的待分类样本关于第一至第C类的相似性得分分别为s1,...,sC,第二个转化方式得出的待分类样本关于第一至第C类的相似性得分分别为t1,...,tC,第三个转化方式得出的待分类样本关于第一至第C类的相似性得分分别为g1,...,gC,则待分类样本关于第一至第j类的最终相似性得分为pj=r1sj+r2tj+r3gj;如果待分类样本关于第k类的最终相似性得分为所有最终相似性得分的最大值,则待分类样本被分类到第k类。
2.根据权利要求1所述的基于LSTM的二维图像的目标类别判识方法,其特征在于:在步骤S1中,行序串联是将一个图像矩阵的第一行、第二行一直到最后一行对应的矢量依次首尾相连结合为一个一维矢量;列序串联是将一个图像矩阵的第一列、第二列一直到最后一列依次首尾相连结合为一个一维矢量,图像矩阵最左边的列称为第一列,图像矩阵最右边的列称为最后一列;从外至内环状串联是从外至内依照环状的方式对图像像素进行串联,得到一维向量。
3.根据权利要求1所述的基于LSTM的二维图像的目标类别判识方法,其特征在于:在步骤S3中,将不同序列在LSTM的输出结果作为特征进行串联融合。
4.根据权利要求3所述的基于LSTM的二维图像的目标类别判识方法,其特征在于:根据步骤S1中的三种转化方式分,对于一张图片,将其得到的三种一维向量一起送入一个LSTM网络,得到的输出结果进行串联,再使用softmax进行分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院,未经哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711071551.7/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序