[发明专利]一种基于测地距离的黎曼流形保持核学习方法及装置有效
申请号: | 201810542508.2 | 申请日: | 2018-05-30 |
公开(公告)号: | CN108764351B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 牛菓;王修才;顾艳春;段志奎;陈建文;樊耘 | 申请(专利权)人: | 佛山科学技术学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 王国标 |
地址: | 528000 广东省佛山市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 距离 黎曼 流形 保持 学习方法 装置 | ||
本发明公开了一种基于测地距离的黎曼流形保持核学习方法及装置,用于解决数字图像的黎曼流形数据的核学习方法的两个问题:1)测度保持问题,通过参数化马氏距离学习的方式,使得黎曼流形上的对称正定矩阵变换到欧式空间上的距离与黎曼流形上的测地距离相等,根据Bregman优化算法求得马氏距离矩阵的最优解;2)固定核方法问题。通过核学习的方式;根据Bregman优化算法,进行核学习得到最优的核矩阵,使得核空间上的距离与测地距离保持一致,最终有效的解决了黎曼流形测度保持以及单一核局限性的问题。
技术领域
本公开涉及机器学习及图像处理领域,具体涉及一种基于测地距离的黎曼流形保持核学习方法及装置。
背景技术
随着多媒体技术的快速发展以及互联网技术的迅猛发展,数字图像信息的采集,存储,传播以及访问呈现出爆炸性的增长。数字图像不仅充斥在互联网上,而且在民用,商业,军事,医疗,生物等领域中都会产生大量的图像信息,包括日常生活中拍摄的照片,新闻图片,医学图片,生物图片,遥感图片等等。上述的种种情况,使得图像的处理变得越来越复杂。由于图像处理所面对的图像数据,数量多且维数高,如果采用传统方法对图像进行处理,会导致高昂的时间成本以及识别率不理想的情况发生。比如图像处理常用的方法里,将一张图像变换成一个行向量或者列向量,即使用一个行向量或列向量来表示一张图像,如果图像维数相对小一些或者维数不太高,这样变换后,运算量不会太大。但是随着互联网技术的迅速发展,图像越来越清晰,维数也越来越大,不再局限在几百维以内,而是几万,几十万维,甚至更大。如果此时再将图像变换成向量,进行后续的分类、识别等应用时,计算量剧增,导致高昂的时间成本产生。每个图像都会有自己的特征,一般情况下,对一个图像而言,常用特征提取方法有协方差描述子(文献1,Tuzel O.,Porikli F.,Meer F.,RegionCovariance:A Fast Descriptor for Detection and Classification,EuropeanConference on Computer Vision(ECCV),2006)、扩散张量描述子(文献2,Pennec X.,Fillard P.,Ayache N.,A Riemannian Framework for Tensor Computing,International Journal of Computer Vision(IJCV),2006),结构张量描述子(文献3,GohA.,Vidal R.,Clustering and dimensionality reduction on Riemannianmanifolds.Computer Vision and Pattern Recognition(CVPR),2008)等。使用协方差矩阵作为区域描述子不但可以融合图像里多个可能相关的特征,还可以从一个区域提取的单个协方差矩阵,来实现在不同的视角和姿势下该区域的匹配问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810542508.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:目标识别方法、装置及电子设备
- 下一篇:重复页面内容检测方法和装置