[发明专利]一种确定聚类样本差异的方法及装置在审
申请号: | 201510446969.6 | 申请日: | 2015-07-27 |
公开(公告)号: | CN105117733A | 公开(公告)日: | 2015-12-02 |
发明(设计)人: | 王淑玲;冯伟斌;王志军 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 样本 差异 方法 装置 | ||
1.一种确定聚类样本差异的方法,其特征在于,包括:
将第一属性样本的属性值映射为二进制码,所述第一属性样本包括多个属性值;
获取第一属性值的二进制码和第二属性值的二进制码;
获取所述第一属性值的二进制码和所述第二属性值的二进制码之间的差异。
2.根据权利要求1所述的方法,其特征在于,当所述第一属性样本为标称属性样本,所述将第一属性样本的属性值映射为二进制码包括:
将所述第一属性样本的属性值映射为s层2k树,所述s为大于等于1的整数,i大于等于1且小于等于s,所述i用于表示s层2k树的第i层,ki用于表示第i层的属性值的个数,第i层的属性值的二进制码为k位。
3.根据权利要求2所述的方法,其特征在于,当所述第i层的属性值由h位的二进制码表示时,所述第i层的属性值对应的k位二进制码为h位的二进制码和k-h位的F,所述h小于k,所述F表示0或1。
4.根据权利要求1所述的方法,其特征在于,当所述第一属性样本为数值属性样本,所述将第一属性样本的属性值映射为二进制码包括:
将所述第一属性样本的属性值映射为s层二叉树,所述s为大于等于1的整数,其中,当第i层的属性值小于中值,所述属性值记为0,当第i层的属性值大于中值,所述属性值记为1,所述中值为第i层属性值的最大属性值与最小属性值之和的一半,i大于等于1且小于等于s。
5.根据权利要求1-4任意一项权利要求所述的方法,其特征在于,当所述第一属性样本包括多维属性的属性值时,
采用空间填充曲线将多维属性的属性值生成二进制码串。
6.一种确定聚类样本差异的装置,其特征在于,包括:
映射单元,用于将第一属性样本的属性值映射为二进制码,所述第一属性样本包括多个属性值;
获取单元,用于获取第一属性值的二进制码和第二属性值的二进制码;
所述获取单元还用于获取所述第一属性值的二进制码和所述第二属性值的二进制码之间的差异。
7.根据权利要求6所述的装置,其特征在于,当所述第一属性样本为标称属性样本,所述映射单元具体用于:
将所述第一属性样本的属性值映射为s层2k树,所述s为大于等于1的整数,i大于等于1且小于等于s,所述i用于表示s层2k树的第i层,ki用于表示第i层的属性值的个数,第i层的属性值的二进制码为k位。
8.根据权利要求7所述的装置,其特征在于,当所述第i层的属性值由h位的二进制码表示时,所述第i层的属性值对应的k位二进制码为h位的二进制码和k-h位的F,所述h小于k,所述F表示0或1。
9.根据权利要求6所述的装置,其特征在于,当所述第一属性样本为数值属性样本,所述映射单元具体用于:
将所述第一属性样本的属性值映射为s层二叉树,所述s为大于等于1的整数,其中,当第i层的属性值小于中值,所述属性值记为0,当第i层的属性值大于中值,所述属性值记为1,所述中值为第i层属性值的最大属性值与最小属性值之和的一半,i大于等于1且小于等于s。
10.根据权利要求6-9任意一项权利要求所述的装置,其特征在于,当所述第一属性样本包括多维属性的属性值时,所述装置还包括:
生成单元,用于采用空间填充曲线将多维属性的属性值生成二进制码串。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510446969.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种液体药品自动取用器
- 下一篇:一种按摩洗脚器