[发明专利]聚类方法及装置在审
申请号: | 201410432412.2 | 申请日: | 2014-08-28 |
公开(公告)号: | CN104268149A | 公开(公告)日: | 2015-01-07 |
发明(设计)人: | 陈志军;张涛;龙飞 | 申请(专利权)人: | 小米科技有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开实施例公开了一种聚类方法及装置,所述聚类方法将样本数据中类间Rank-Order距离DR(Ci,Cj)、类间归一化Rank-Order距离DN(Ci,Cj)和类间绝对距离d(Ci,Cj)符合条件的类进行迭代合并,其中,通过类间Rank-Order距离DR(Ci,Cj)和类间归一化Rank-Order距离DN(Ci,Cj)可以度量类与类之间的邻居关系,通过类间绝对距离d(Ci,Cj)度量类与类之间的绝对距离关系,根据类间绝对距离可以准确度量两个类直接的相似度,根据类间绝对距离将相似度较小的类划分出来,即确定出类中的离群点。从而实现在聚类过程中将相似度较小的离群点剔除掉,提高聚类结果的准确率。尤其,当样本数据中数据对象较多,但属于同一类的数据对象比较少时,聚类结果的准确比较高。 | ||
搜索关键词: | 方法 装置 | ||
【主权项】:
一种聚类方法,其特征在于,包括:获取样本数据中任意两个类Ci与Cj之间的类间Rank‑Order距离DR(Ci,Cj)、类间绝对距离d(Ci,Cj)及类间归一化Rank‑Order距离DN(Ci,Cj);针对所述样本数据中的任意两个类Ci与Cj,根据所述类间Rank‑Order距离DR(Ci,Cj)、所述类间归一化Rank‑Order距离DN(Ci,Cj)和所述类间绝对距离d(Ci,Cj),判断所述两个类Ci与Cj是否是候选合并类;当所述任意两个类Ci与Cj是候选合并类时,合并所述候选合并类,并更新类的数量;当更新后的类的数量比更新前的类的数量少时,返回执行获取任意两个类Ci与Cj之间的类间Rank‑Order距离DR(Ci,Cj)、类间绝对距离d(Ci,Cj)及类间归一化Rank‑Order距离DN(Ci,Cj)的步骤,直到更新后的类的数量与更新前的类的数量相同,得到聚类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于小米科技有限责任公司,未经小米科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410432412.2/,转载请声明来源钻瓜专利网。
- 上一篇:双螺旋饲草称重送料装置
- 下一篇:一种输料机及其外罩装置