[发明专利]基于量子计算的文本聚类方法、装置、介质及电子装置在审

专利信息
申请号: 202210154196.4 申请日: 2022-02-21
公开(公告)号: CN114282000A 公开(公告)日: 2022-04-05
发明(设计)人: 窦猛汉;方圆;李蕾;王伟 申请(专利权)人: 合肥本源量子计算科技有限责任公司
主分类号: G06F16/35 分类号: G06F16/35;G06K9/62;G06N10/60
代理公司: 暂无信息 代理人: 暂无信息
地址: 230088 安徽省合肥市合肥市高*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 量子 计算 文本 方法 装置 介质 电子
【说明书】:

发明公开了一种基于量子计算的文本聚类方法、装置、介质及电子装置,该方法包括:制备待聚类文本对应的第一量子态和用于聚类的聚类中心对应的第二量子态,其中,一个所述聚类中心对应一类;运行并测量第一预设量子线路,获得所述第一量子态和第二量子态之间的相似度;根据所述第一量子态和所述第二量子态之间的相似度,对所述待聚类文本进行聚类。利用本发明实施例,能够将量子计算技术与聚类算法进行结合,发挥量子计算的并行加速优势,降低处理传统聚类任务时所需要的计算量,并填补相关技术的空白。

技术领域

本发明涉及量子计算技术领域,尤其涉及一种基于量子计算的文本聚类方法、装置、介质及电子装置。

背景技术

聚类算法是一种经典的无监督机器学习方法,对于给定的样本集,按照样本之间的距离大小,将样本集划分为若干个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大,其作用是将具有相似特征的样本聚为一类。

目前,聚类算法需要处理的数据量与样本的数量正相关,当样本的数量足够大时,聚类算法处理数据需要的计算复杂度也会变大,如何降低聚类算法的计算复杂度就成为了一个亟待解决的问题。

发明内容

本发明提供了一种基于量子计算的文本聚类方法、装置、介质及电子装置,将量子计算与聚类算法进行结合,发挥量子计算的并行加速优势,用于降低处理传统聚类任务时所需要的计算量。

本发明的一个实施例提供了一种基于量子计算的文本聚类方法,方法包括:

制备待聚类文本对应的第一量子态和用于聚类的聚类中心对应的第二量子态,其中,一个所述聚类中心对应一类;

运行并测量第一预设量子线路,获得所述第一量子态和第二量子态之间的相似度;

根据所述第一量子态和所述第二量子态之间的相似度,对所述待聚类文本进行聚类。

可选的,所述制备待聚类文本对应的第一量子态和用于聚类的聚类中心对应的第二量子态,包括:

获取待聚类文本对应的文本向量和用于聚类的聚类中心对应的中心向量,制备所述文本向量对应的第一量子态和所述中心向量对应的第二量子态。

可选的,所述获取待聚类文本对应的文本向量和用于聚类的聚类中心对应的中心向量,包括:

获取待聚类文本对应的文本向量和用于聚类的聚类中心对应的中心向量,并对所述文本向量和所述中心向量进行降维处理。

可选的,所述获取待聚类文本对应的文本向量和用于聚类的聚类中心对应的中心向量,并对所述文本向量和所述中心向量进行降维处理,包括:

获取待聚类文本,将所述待聚类文本输入至预训练好的双向编码器BERT模型,得到所述待聚类文本对应的文本向量;

初始化用于聚类的聚类中心对应的中心向量,将所述文本向量和所述中心向量输入至预训练好的主成分分析PCA模型,得到降维后的所述文本向量和所述中心向量。

可选的,所述根据所述第一量子态和所述第二量子态之间的相似度,对所述待聚类文本进行聚类,包括:

针对每一所述第一量子态,在所述第一量子态与各所述第二量子态之间的相似度中,查找满足第一预设条件的相似度所对应的第二量子态;

将所述第一量子态对应的待聚类文本划分至查找到的第二量子态对应的类中。

可选的,所述方法还包括:

确定当前聚类后的各个类的聚类中心,判断所确定的聚类中心是否满足第二预设条件;

若不满足所述第二预设条件,则将所述用于聚类的聚类中心更新为所述所确定的聚类中心,返回执行所述制备待聚类文本对应的第一量子态和用于聚类的聚类中心对应的第二量子态的步骤。

可选的,所述判断所确定的聚类中心是否满足第二预设条件,包括:

计算所述所确定的聚类中心与所述用于聚类的聚类中心之间的偏移距离;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥本源量子计算科技有限责任公司,未经合肥本源量子计算科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210154196.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top