[发明专利]一种基于快速多图融合学习的立体视觉对象识别系统有效
申请号: | 201910071913.5 | 申请日: | 2019-01-25 |
公开(公告)号: | CN109829413B | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 高跃;林浩杰;张子昭 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京律谱知识产权代理事务所(普通合伙) 11457 | 代理人: | 黄云铎 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 快速 融合 学习 立体 视觉 对象 识别 系统 | ||
1.一种基于快速多图融合学习的立体视觉对象识别系统,其特征在于,该系统包括:构建模块,计算模块以及生成模块;
所述构建模块用于根据数据库中的图像数据,分别构建所述数据库的至少两个数据模态的图和图矩阵;
所述计算模块用于根据所述图矩阵,计算所述数据库对应数据模态的概率转移矩阵,所述计算模块还用于根据一个数据模态的所述图和另一个数据模态的所述概率转移矩阵,计算所述数据库对应数据模态的第一标签矩阵,其中,所述计算模块具体包括:生成单元,计算单元以及校正单元;
所述生成单元用于根据所述图,生成第二标签矩阵;
所述计算单元用于所述图矩阵,计算概率转移矩阵,所述计算单元还用于根据一个数据模态对应的所述第二标签矩阵和另一个数据模态对应的所述概率转移矩阵,计算所述一个数据模态对应的传递矩阵,记作第三标签矩阵;
所述校正单元用于根据所述第二标签矩阵,校正所述第三标签矩阵,将校正后的所述第三标签矩阵,记作所述第一标签矩阵;
所述生成模块用于根据至少两个数据模态的所述第一标签矩阵,对所述数据库中的未标记图像数据进行标记,生成并发送立体视觉对象识别结果。
2.如权利要求1所述的基于快速多图融合学习的立体视觉对象识别系统,其特征在于,所述构建模块具体包括:获取单元,提取单元,以及构建单元;
所述获取单元用于获取所述数据库中立体视觉对象的所述图像数据,其中,所述图像数据包括已标记图像数据和未标记图像数据,所述已标记图像数据中包括标签;
所述提取单元用于提取所述图像数据至少两种类型的特征模态数据;
所述构建单元用于根据所述特征模态数据,构建所述数据库的所述图,并生成对应的所述图矩阵,其中,所述图的任一个节点为所述立体视觉对象,任意两个所述节点之间连接有边,所述边的取值为两个所述节点之间相似度的权重值。
3.如权利要求2所述的基于快速多图融合学习的立体视觉对象识别系统,其特征在于,
所述构建单元计算两个所述节点之间权重值的计算公式为:
式中,W(i,j)为节点i和节点j之间的权重值,vi为所述节点i的所述特征模态数据,vj为所述节点j的所述特征模态数据,d(·)2为欧几里德距离函数,μ为第一超常数,σ为第二超常数。
4.如权利要求1所述的基于快速多图融合学习的立体视觉对象识别系统,其特征在于,
所述计算单元还用于采用迭代算法,根据所述一个数据模态对应的所述第三标签矩阵和所述另一个数据模态对应的所述概率转移矩阵,更新所述传递矩阵,并将更新后的所述传递矩阵记作所述第三标签矩阵。
5.如权利要求4所述的基于快速多图融合学习的立体视觉对象识别系统,其特征在于,所述计算模块,具体还包括:判断单元;
所述判断单元用于判断迭代次数是否达到预设迭代次数;
所述计算单元还用于当判定当前的所述迭代次数达到所述预设迭代次数时,停止迭代运算,将当前的所述传递矩阵,记作所述第三标签矩阵。
6.如权利要求4所述的基于快速多图融合学习的立体视觉对象识别系统,其特征在于,所述识别系统还包括:优化模块;
所述优化模块用于根据所述第三标签矩阵,生成相关性矩阵,并根据所述相关性矩阵,优化所述概率转移矩阵;
所述计算单元还用于采用迭代算法,根据所述一个数据模态对应的所述第三标签矩阵和所述另一个数据模态对应的优化后的所述概率转移矩阵,更新所述传递矩阵,并将更新后的所述传递矩阵记作所述第三标签矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910071913.5/1.html,转载请声明来源钻瓜专利网。