[发明专利]一种量子行走的空间聚类方法有效
申请号: | 201710351832.1 | 申请日: | 2017-05-18 |
公开(公告)号: | CN107194421B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 董玉民;肖淑芬 | 申请(专利权)人: | 青岛理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 赵敏玲 |
地址: | 266033 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 量子 行走 空间 方法 | ||
1.一种量子行走的空间聚类方法,其特征是,包括:
步骤一,初始化n维空间,n为数据点的维度,并将数据点自然映射到空间上;定义一个距离函数;对于3维的情况,使任意空间中的数据点具有相同的行走环境,设定量子行走空间的上下、左右、前后边界相连;
步骤二,检查包括数据点的空间数目λ与聚类数目θ之间的关系,如果λ>θ,找出潜在的孤立点空间,并分别计算含有数据点的空间中所含数据点数量最少的空间Vmin相对于含有数据点的邻域中每个空间的总收益;若λ=θ,则执行步骤四;
步骤三,空间合并与坍缩,整个空间按照少数服从多数的原则合并到某个邻域空间中,合并后的空间体坍缩到一个空间的大小;合并坍缩后跳回步骤二;
步骤四,当包含数据点的空间数量达到聚类数时,如果空间不相邻,则结束,得到相应的聚类结果;
将上述步骤应用于网络舆情分析与监管,所述数据点映射为舆情话题,通过识别和聚焦敏感话题和热点话题,并进行负面舆情研判,实现自动摘要、自动提取关键词和要素。
2.如权利要求1所述一种量子行走的空间聚类方法,其特征是,所述步骤一中的距离函数满足两个点之间的距离越靠近时,函数值就越小。
3.如权利要求1所述一种量子行走的空间聚类方法,其特征是,所述步骤二中,孤立点空间的寻找方法为:
查找含有数据点的空间中所含数据点数量最少的空间,记为Vmin;若其邻域没有数据点,则将其邻域都并入Vmin;如果合并后的Vmin所占体积达到总体积设定,则该空间即为潜在的孤立点空间。
4.如权利要求1所述一种量子行走的空间聚类方法,其特征是,所述步骤二中总收益的计算方法为,
查找含有数据点的空间中所含数据点数量最少的空间,记为Vmin,如果Vmin的邻域中有数据点,则Vmin中的所有数据点分别与邻域内的所有数据点进行一次收益比较,然后分别计算出Vmin中数据点相对邻域中每个空间的总收益。
5.如权利要求1所述一种量子行走的空间聚类方法,其特征是,所述步骤三中的具体方法为,计算Vmin中的每个数据点相对于含有数据点的邻域内的所有数据点的收益,根据计算出的收益决定新的归属,整个空间按照少数服从多数的原则合并到某个邻域空间中;合并后的空间体积并不扩大,而是坍缩到一个空间的大小。
6.如权利要求1所述一种量子行走的空间聚类方法,其特征是,所述步骤四中,如果空间相邻,则相邻空间中的数据点再与邻域空间中的数据点进行一次比较,确定最终的归属空间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛理工大学,未经青岛理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710351832.1/1.html,转载请声明来源钻瓜专利网。