[发明专利]基于量子计算的文本聚类方法、装置、介质及电子装置在审
申请号: | 202210154196.4 | 申请日: | 2022-02-21 |
公开(公告)号: | CN114282000A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 窦猛汉;方圆;李蕾;王伟 | 申请(专利权)人: | 合肥本源量子计算科技有限责任公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06N10/60 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 230088 安徽省合肥市合肥市高*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 量子 计算 文本 方法 装置 介质 电子 | ||
1.一种基于量子计算的文本聚类方法,其特征在于,所述方法包括:
制备待聚类文本对应的第一量子态和用于聚类的聚类中心对应的第二量子态,其中,一个所述聚类中心对应一类;
运行并测量第一预设量子线路,获得所述第一量子态和第二量子态之间的相似度;
根据所述第一量子态和所述第二量子态之间的相似度,对所述待聚类文本进行聚类。
2.根据权利要求1所述的方法,其特征在于,所述制备待聚类文本对应的第一量子态和用于聚类的聚类中心对应的第二量子态,包括:
获取待聚类文本对应的文本向量和用于聚类的聚类中心对应的中心向量,制备所述文本向量对应的第一量子态和所述中心向量对应的第二量子态。
3.根据权利要求2所述的方法,其特征在于,所述获取待聚类文本对应的文本向量和用于聚类的聚类中心对应的中心向量,包括:
获取待聚类文本对应的文本向量和用于聚类的聚类中心对应的中心向量,并对所述文本向量和所述中心向量进行降维处理。
4.根据权利要求3所述的方法,其特征在于,所述获取待聚类文本对应的文本向量和用于聚类的聚类中心对应的中心向量,并对所述文本向量和所述中心向量进行降维处理,包括:
获取待聚类文本,将所述待聚类文本输入至预训练好的双向编码器BERT模型,得到所述待聚类文本对应的文本向量;
初始化用于聚类的聚类中心对应的中心向量,将所述文本向量和所述中心向量输入至预训练好的主成分分析PCA模型,得到降维后的所述文本向量和所述中心向量。
5.根据权利要求1所述的方法,其特征在于,所述根据所述第一量子态和所述第二量子态之间的相似度,对所述待聚类文本进行聚类,包括:
针对每一所述第一量子态,在所述第一量子态与各所述第二量子态之间的相似度中,查找满足第一预设条件的相似度所对应的第二量子态;
将所述第一量子态对应的待聚类文本划分至查找到的第二量子态对应的类中。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定当前聚类后的各个类的聚类中心,判断所确定的聚类中心是否满足第二预设条件;
若不满足所述第二预设条件,则将所述用于聚类的聚类中心更新为所述所确定的聚类中心,返回执行所述制备待聚类文本对应的第一量子态和用于聚类的聚类中心对应的第二量子态的步骤。
7.根据权利要求6所述的方法,其特征在于,所述判断所确定的聚类中心是否满足第二预设条件,包括:
计算所述所确定的聚类中心与所述用于聚类的聚类中心之间的偏移距离;
若所述偏移距离小于预设阈值,判断为所确定的聚类中心满足第二预设条件;
若所述偏移距离不小于预设阈值,判断为所确定的聚类中心不满足第二预设条件。
8.一种基于量子计算的文本聚类装置,其特征在于,所述装置包括:
制备模块,用于制备待聚类文本对应的第一量子态和用于聚类的聚类中心对应的第二量子态,其中,一个所述聚类中心对应一类;
获得模块,用于运行并测量第一预设量子线路,获得所述第一量子态和第二量子态之间的相似度;
聚类模块,用于根据所述第一量子态和所述第二量子态之间的相似度,对所述待聚类文本进行聚类。
9.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至7任一项所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至7任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥本源量子计算科技有限责任公司,未经合肥本源量子计算科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210154196.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种运算放大器输入电流的抵消电路
- 下一篇:聚乙二醇脂质及其应用