[发明专利]一种混合聚类方法和装置有效
申请号: | 201410040796.3 | 申请日: | 2014-01-28 |
公开(公告)号: | CN104809136B | 公开(公告)日: | 2019-03-15 |
发明(设计)人: | 刘军;冯兴;周继恩 | 申请(专利权)人: | 中国银联股份有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 臧霁晨;汤春龙 |
地址: | 200135 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 混合 方法 装置 | ||
1.一种混合聚类方法,包括:
输入聚类参数,所述聚类参数包括主控参数和算法参数,其中主控参数包括更新类型、BY GROUP特征变量、minhash特征变量及权重、聚类对象的过滤条件、最小对象数,算法参数包括哈希函数种子列表、主键数、simhash签名位数;
如果更新类型为全量更新,那么删除聚类结果中对应的组;
输入满足过滤条件的对象,对每个对象进行混合聚类,生成聚类的组名,输出聚类的组和对象列表;
输入聚类的组和对象列表,丢弃对象数小于最小对象数的组,添加其余的组和对象到聚类结果中。
2.根据权利要求1所述的混合聚类方法,其中,
所述对每个对象进行混合聚类,生成聚类的组名,输出聚类的组名和对象列表包括以下步骤:
步骤(a):判定BY GROUP特征变量,如果BY GROUP特征变量为空,那么跳到步骤(c);
步骤(b):根据BY GROUP特征变量,来进行BY GROUP聚类,并确定BY GROUP聚类结果的组名;
步骤(c):判定minhash特征变量,如果minhash特征变量为空,那么跳到步骤(f);
步骤(d):根据simhash签名位数、minhash特征变量及权重,来使用simhash求得对象的签名;
步骤(e):根据求得的对象的签名,来进行minhash聚类,根据主键数来确定minhash聚类结果的组名;
步骤(f):将BY GROUP聚类结果的组名和minhash聚类结果的组名组合成聚类的组名;
步骤(g):输出聚类的组名和对象列表。
3.一种混合聚类装置,包括:
聚类对象管理模块,其向混合聚类执行模块输出满足过滤条件的对象;
聚类参数管理模块,其向混合聚类执行模块输出聚类参数;
混合聚类执行模块,其基于满足过滤条件的对象以及聚类参数,来进行混合聚类,向聚类结果管理模块输出聚类的组和对象列表;
聚类结果管理模块,其对聚类结果进行管理,
所述混合聚类装置执行以下步骤:
输入聚类参数,所述聚类参数包括主控参数和算法参数,其中主控参数包括更新类型、BY GROUP特征变量、minhash特征变量及权重、聚类对象的过滤条件、最小对象数,算法参数包括哈希函数种子列表、主键数、simhash签名位数;
如果更新类型为全量更新,那么删除聚类结果中对应的组;
输入满足过滤条件的对象,对每个对象进行混合聚类,生成聚类的组名,输出聚类的组和对象列表;
输入聚类的组和对象列表,丢弃对象数小于最小对象数的组,添加其余的组和对象到聚类结果中。
4.根据权利要求3所述的混合聚类装置,其中,
所述对每个对象进行混合聚类,生成聚类的组名,输出聚类的组名和对象列表包括以下步骤:
步骤(a):判定BY GROUP特征变量,如果BY GROUP特征变量为空,那么跳到步骤(c);
步骤(b):根据BY GROUP特征变量,来进行BY GROUP聚类,并确定BY GROUP聚类结果的组名;
步骤(c):判定minhash特征变量,如果minhash特征变量为空,那么跳到步骤(f);
步骤(d):根据simhash签名位数、minhash特征变量及权重,来使用simhash求得对象的签名;
步骤(e):根据求得的对象的签名,来进行minhash聚类,根据主键数来确定minhash聚类结果的组名;
步骤(f):将BY GROUP聚类结果的组名和minhash聚类结果的组名组合成聚类的组名;
步骤(g):输出聚类的组名和对象列表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410040796.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种光伏组件边框和光伏组件
- 下一篇:幕墙式太阳能光伏组件