[发明专利]一种重叠社区集合质量度量指标的计算方法及装置有效
申请号: | 201810386264.3 | 申请日: | 2018-04-26 |
公开(公告)号: | CN108898264B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 冯禹洪;吴远诗;佘松;罗秋明 | 申请(专利权)人: | 深圳大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/00 |
代理公司: | 深圳市恒申知识产权事务所(普通合伙) 44312 | 代理人: | 王利彬 |
地址: | 518060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 重叠 社区 集合 质量 度量 指标 计算方法 装置 | ||
1.一种重叠社区集合质量度量指标的计算方法,其特征在于,该方法包括以下步骤:
步骤1、获取社区集合X={X1,X2,...XK}、Y={Y1,Y2,...YK'},及包含社区集合X、Y中各社区的顶点集合V={v1,v2,...vn};所述K、K'、n分别表示社区集合X、Y以及顶点集合V中的元素个数;
步骤2、根据所述顶点集合V={v1,v2,...vn}中的每个顶点vi,分别遍历社区集合X={X1,X2,...XK}、Y={Y1,Y2,...YK'}中的各社区,记录各顶点vi在社区集合X、Y中所属社区的标签,得到标签集合ListXid[i]、ListYid[i],i为大于0小于n的整数;
步骤3、根据DicList[i]=ListXid[i]×ListYid[i],构建对应于每个顶点vi的社区标签笛卡尔乘积数据集DicList[i];
步骤4、按照元素类型(key,value),将各顶点vi对应的((DicList[i][j].1,0),DicList[i][j].2)、((DicList[i][j].2,1),DicList[i][j].1)元素添加至社区标签数据集合LidList,所述key为(key,value)类型的复合key;所述j为社区标签笛卡尔乘积数据集DicList[i]中元素的标签;
步骤5、基于贪心算法和负载均衡,对所述社区标签数据集合LidList进行切分,并将切分得到的元素分发至多个进程;由各进程根据分发得到的元素进行运算处理,得到计算各指标的所需数值;
步骤6、将所述各进程的所述各指标相关数值发送至单一进程,由所述单一进程进行运算,输出所述社区集合X、Y的度量指标。
2.如权利要求1所述的重叠社区集合质量度量指标的计算方法,其特征在于,在步骤5中,所述基于贪心算法和负载均衡,对所述社区标签数据集合LidList进行切分,并将切分得到的元素分发至多个进程的步骤包括:
构建各进程对应的新建社区标签数据集合NewLidList;
基于贪心算法和负载均衡,将所述社区标签数据集合LidList进行划分至各进程对应的新建社区标签数据集合NewLidList。
3.如权利要求2所述的重叠社区集合质量度量指标的计算方法,其特征在于,在步骤5中,所述由各进程根据分发得到的元素进行运算处理,得到计算各指标的所需数值的步骤包括:
将所述新建社区标签数据集合NewLidList中的各元素对key按字典序排序,并统计同一key中,不同value出现的次数;
根据所述新建社区标签数据集合NewLidList中的元素以及所述元素个数进行运算处理,得到计算各指标的所需数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810386264.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理