[发明专利]一种面向聚类算法的距离计算系统及方法在审

专利信息
申请号: 202011191128.2 申请日: 2020-10-30
公开(公告)号: CN114529744A 公开(公告)日: 2022-05-24
发明(设计)人: 俞红祥;杨以杰;杨振亚 申请(专利权)人: 安世亚太科技股份有限公司
主分类号: G06V10/762 分类号: G06V10/762;G06K9/62
代理公司: 北京智为时代知识产权代理事务所(普通合伙) 11498 代理人: 王加岭;杨静
地址: 100025 北京市朝阳区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 算法 距离 计算 系统 方法
【说明书】:

一种面向聚类算法的距离计算系统及方法。在基于科氏复杂度的信息距离理论基础上,设计信息距离计算、无损情况下的压缩距离计算和有损情况下的压缩距离计算统一的方法,并形成有损情况下的压缩距离计算系统,解决了面向图像、视频等连续数据的有损压缩距离计算问题,并形成一套完整统一的、面向任何数据类型的压缩距离计算方法及系统。

技术领域

发明属于人工智能技术领域,具体涉及一种面向聚类算法的距离计算系统及方法。

背景技术

目前聚类算法距离计算方法和系统存在的问题包括如下:

当前研究较多的聚类方法多是基于特征的,是通过提取数据的某种特征,并比较该特征进行分类。这种的局限性在于对数据完整特征的捕获具有片面性。因此,近年来相关领域研究人员对基于非特征相似度的聚类进行研究。这种方式旨在通过一种统一的相似性度量,包含所有的有效聚类距离。据此发展出来了基于科莫格罗夫复杂度(以下简称科氏复杂度)的数据绝对信息度量理论。两个对象X和Y之间的信息距离定义为从X转换成Y和从Y转换成X的最小的计算机程序。

但是,在图灵计算机上这个距离是不可计算的。一种有效的解决方案是把这个最小的计算机程序用普适最优的信源编码来代替。这样就把寻找最小计算机程序的问题转换成了选择对于数据的最优压缩方案的问题。基于这个思路,业界提出了压缩距离的概念来近似信息距离,通过实际的压缩编码器来实现。这种方法的优点在于,它并不需要任何对于数据的背景知识,并且近年来被证明是一种可以适用于任何参数、任何特征的数据挖掘方法。

然而,以上研究中的信息和压缩距离都是基于离散数据的,而对于像图像和视频这样的连续数据是不适用的。最近几年业界的研究中在信息距离中引入了失真,并用有损信源编码速率来表达聚类距离。跟无损情况下一样,这个值的可计算性需要通过有效的有损压缩方案来来实现。

发明内容

本发明旨在提供一种面向聚类算法的距离计算方法及系统,在基于科氏复杂度的信息距离理论基础上,设计信息距离计算、无损情况下的压缩距离计算和有损情况下的压缩距离计算统一的方法,并形成有损情况下的压缩距离计算系统,解决了面向图像、视频等连续数据的有损压缩距离计算问题,并形成一套完整统一的、面向任何数据类型的压缩距离计算方法及系统。

具体的,一种面向聚类算法的信息距离的计算系统,包括二进制计算机一(11),二进制计算机二(12),和信息距离最大值计算器(13);所述二进制计算机一(11)包括最短程序一(1101)和长度计算器一(1102),用于计算科氏复杂度一;所述二进制计算机二(12)包括最短程序二(1201)和长度计算器二(1202),用于计算科氏复杂度二;所述信息距离最大值计算器(13),将科氏复杂度一和科氏复杂度二作为输入信息,计算得到输入对象X和输入对象Y之间的信息距离。

优选的,所述二进制计算机一以输入对象X作为输入,输出对象Y作为输出,通过最短程序一(1101),计算从输入对象X得到输出对象Y的最短程序,并通过长度计算器一(1102),计算最短程序的长度,并得到科氏复杂度一。

优选的,所述二进制计算机二以输入对象Y作为输入,输出对象X作为输出,通过最短程序二(1201),计算从输入对象Y得到输出对象X的最短程序,并通过长度计算器二(1202),计算最短程序的长度,并得到科氏复杂度二。

优选的,所述二进制计算机一为Y的无损压缩长度计算器(21),用于计算Y的无损压缩长度;所述二进制计算机二为X的无损压缩长度计算器(22),用于计算X的无损压缩长度;所述信息距离最大值计算器为无损压缩距离最大值计算器(23),通过输入X的无损压缩长度和Y的无损压缩长度,得到输入对象X和输入对象Y之间的无损压缩距离。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安世亚太科技股份有限公司,未经安世亚太科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011191128.2/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top