[发明专利]基于量子计算的谱聚类方法、装置、电子设备及存储介质在审
申请号: | 202210154362.0 | 申请日: | 2022-02-21 |
公开(公告)号: | CN114219048A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 方圆;王伟;李蕾;窦猛汉 | 申请(专利权)人: | 合肥本源量子计算科技有限责任公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N10/60 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 230088 安徽省合肥市合肥市高*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 量子 计算 谱聚类 方法 装置 电子设备 存储 介质 | ||
本发明公开了一种基于量子计算的谱聚类方法、装置、电子设备及存储介质,方法包括:获取待聚类的数据集,分别制备数据集内所有数值的量子态,并将所有数值的量子态每两个作为第一预设量子线路的初态;运行并测量第一预设量子线路,第一预设量子线路用于计算量子态间的相似度;根据测量结果得到量子态间的相似度,基于相似度构建用于谱聚类的拉普拉斯矩阵;根据拉普拉斯矩阵,确定数据集对应的待聚类样本,并根据待聚类样本完成谱聚类。利用本发明实施例,能够将量子计算与谱聚类算法进行结合,发挥量子计算的并行加速优势,降低处理传统谱聚类任务时所需要的计算量。
技术领域
本发明涉及量子计算技术领域,尤其涉及一种基于量子计算的谱聚类方法、装置、电子设备及存储介质。
背景技术
聚类算法是一种经典的无监督机器学习方法,对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大,其作用是将具有相似特征的样本聚为一类。
目前,谱聚类算法是聚类算法中对于分布较稀疏的点聚类效果比较好的一种聚类算法,谱聚类算法需要处理的数据量与样本的数量正相关,当样本的数量足够大时,谱聚类算法处理数据需要的计算复杂度也会变大,如何降低谱聚类算法的计算复杂度就成为了一个亟待解决的问题。
发明内容
本发明提供了一种基于量子计算的谱聚类方法、装置、电子设备及存储介质,将量子计算与谱聚类算法进行结合,发挥量子计算的并行加速优势,降低处理传统谱聚类任务时所需要的计算量。
第一方面,本发明实施例提供一种基于量子计算的谱聚类方法,包括:
获取待聚类的数据集,分别制备所述数据集内所有数值的量子态,并将所述所有数值的量子态每两个作为第一预设量子线路的初态;
运行并测量所述第一预设量子线路,所述第一预设量子线路用于计算所述量子态间的相似度;
根据测量结果得到所述量子态间的相似度,基于所述相似度构建用于谱聚类的拉普拉斯矩阵;
根据所述拉普拉斯矩阵,确定所述数据集对应的待聚类样本,并根据所述待聚类样本完成谱聚类。
可选地,所述根据测量结果得到所述量子态间的相似度,基于所述相似度构建用于谱聚类的拉普拉斯矩阵,包括:
根据所述量子态间的相似度生成与所述数据集对应的相似矩阵;
根据所述相似矩阵的对角线生成度矩阵,并根据所述相似矩阵与所述度矩阵构建拉普拉斯矩阵。
可选地,所述根据所述拉普拉斯矩阵,确定所述数据集对应的待聚类样本,包括:
将所述拉普拉斯矩阵按照预设方式标准化,计算所述标准化后的拉普拉斯矩阵的n个特征向量,将所述n个特征向量作为待聚类样本。
可选地,所述根据所述待聚类样本进行谱聚类,包括:
分别计算每个所述特征向量与其他n-1个特征向量的距离;
根据所述距离以及第一预设条件对所述待聚类样本进行簇的划分,其中,所述第一预设条件包括簇的个数以及每个簇对应簇心。
可选地,所述方法还包括:
判断划分后的所述簇是否满足第二预设条件;
若不满足所述第二预设条件,则更新所述簇心并根据更新后的簇心重新计算所述相似度。
可选地,所述判断划分后的所述簇是否满足第二预设条件,包括:
获取所述簇心更新的次数;
若所述次数不小于第一预设值,判断为满足第二预设条件;
若所述次数小于第一预设值,则判断为不满足第二预设条件。
可选地,所述判断划分后的所述簇是否满足第二预设条件,包括:
获取所述簇心的更新对应的偏移距离;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥本源量子计算科技有限责任公司,未经合肥本源量子计算科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210154362.0/2.html,转载请声明来源钻瓜专利网。