[发明专利]基于量子计算的文本聚类方法、装置、介质及电子装置在审
申请号: | 202210154196.4 | 申请日: | 2022-02-21 |
公开(公告)号: | CN114282000A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 窦猛汉;方圆;李蕾;王伟 | 申请(专利权)人: | 合肥本源量子计算科技有限责任公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06N10/60 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 230088 安徽省合肥市合肥市高*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 量子 计算 文本 方法 装置 介质 电子 | ||
本发明公开了一种基于量子计算的文本聚类方法、装置、介质及电子装置,该方法包括:制备待聚类文本对应的第一量子态和用于聚类的聚类中心对应的第二量子态,其中,一个所述聚类中心对应一类;运行并测量第一预设量子线路,获得所述第一量子态和第二量子态之间的相似度;根据所述第一量子态和所述第二量子态之间的相似度,对所述待聚类文本进行聚类。利用本发明实施例,能够将量子计算技术与聚类算法进行结合,发挥量子计算的并行加速优势,降低处理传统聚类任务时所需要的计算量,并填补相关技术的空白。
技术领域
本发明涉及量子计算技术领域,尤其涉及一种基于量子计算的文本聚类方法、装置、介质及电子装置。
背景技术
聚类算法是一种经典的无监督机器学习方法,对于给定的样本集,按照样本之间的距离大小,将样本集划分为若干个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大,其作用是将具有相似特征的样本聚为一类。
目前,聚类算法需要处理的数据量与样本的数量正相关,当样本的数量足够大时,聚类算法处理数据需要的计算复杂度也会变大,如何降低聚类算法的计算复杂度就成为了一个亟待解决的问题。
发明内容
本发明提供了一种基于量子计算的文本聚类方法、装置、介质及电子装置,将量子计算与聚类算法进行结合,发挥量子计算的并行加速优势,用于降低处理传统聚类任务时所需要的计算量。
本发明的一个实施例提供了一种基于量子计算的文本聚类方法,方法包括:
制备待聚类文本对应的第一量子态和用于聚类的聚类中心对应的第二量子态,其中,一个所述聚类中心对应一类;
运行并测量第一预设量子线路,获得所述第一量子态和第二量子态之间的相似度;
根据所述第一量子态和所述第二量子态之间的相似度,对所述待聚类文本进行聚类。
可选的,所述制备待聚类文本对应的第一量子态和用于聚类的聚类中心对应的第二量子态,包括:
获取待聚类文本对应的文本向量和用于聚类的聚类中心对应的中心向量,制备所述文本向量对应的第一量子态和所述中心向量对应的第二量子态。
可选的,所述获取待聚类文本对应的文本向量和用于聚类的聚类中心对应的中心向量,包括:
获取待聚类文本对应的文本向量和用于聚类的聚类中心对应的中心向量,并对所述文本向量和所述中心向量进行降维处理。
可选的,所述获取待聚类文本对应的文本向量和用于聚类的聚类中心对应的中心向量,并对所述文本向量和所述中心向量进行降维处理,包括:
获取待聚类文本,将所述待聚类文本输入至预训练好的双向编码器BERT模型,得到所述待聚类文本对应的文本向量;
初始化用于聚类的聚类中心对应的中心向量,将所述文本向量和所述中心向量输入至预训练好的主成分分析PCA模型,得到降维后的所述文本向量和所述中心向量。
可选的,所述根据所述第一量子态和所述第二量子态之间的相似度,对所述待聚类文本进行聚类,包括:
针对每一所述第一量子态,在所述第一量子态与各所述第二量子态之间的相似度中,查找满足第一预设条件的相似度所对应的第二量子态;
将所述第一量子态对应的待聚类文本划分至查找到的第二量子态对应的类中。
可选的,所述方法还包括:
确定当前聚类后的各个类的聚类中心,判断所确定的聚类中心是否满足第二预设条件;
若不满足所述第二预设条件,则将所述用于聚类的聚类中心更新为所述所确定的聚类中心,返回执行所述制备待聚类文本对应的第一量子态和用于聚类的聚类中心对应的第二量子态的步骤。
可选的,所述判断所确定的聚类中心是否满足第二预设条件,包括:
计算所述所确定的聚类中心与所述用于聚类的聚类中心之间的偏移距离;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥本源量子计算科技有限责任公司,未经合肥本源量子计算科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210154196.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种运算放大器输入电流的抵消电路
- 下一篇:聚乙二醇脂质及其应用