[发明专利]一种分类方法在审
申请号: | 202010651577.4 | 申请日: | 2020-07-08 |
公开(公告)号: | CN111985530A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 马燕;王妍;黄慧;李顺宝;徐晓钟 | 申请(专利权)人: | 上海师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 上海宛林专利代理事务所(普通合伙) 31361 | 代理人: | 张明 |
地址: | 200234 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分类 方法 | ||
1.一种分类方法,其特征在于,包括以下步骤:
获取待分类的数据;
根据获取的待分类的数据,对所述待分类的数据使用无监督学习算法进行分类处理;
根据分类处理,得到分类结果。
2.如权利要求1所述的一种分类方法,其特征在于,根据获取的待分类的数据,对待分类的数据进行分类处理,具体包括以下步骤:
步骤一,将获取的待分类的数据记为数据集X={x1,x2,L,xn},其中,xi(i=1,2,L,n)表示第i条儿童自我护理能力数据,xi={xi1,xi2,L,xid},xij(j=1,2,L,d)表示第i条数据内的第j个属性,儿童的自我保健问题的类别数目为K;
步骤二、利用数据在近邻关系上的活跃程度,将所述数据集X划分为两个具有不同分布特性的子集X1与X2;
步骤三、利用最近邻关系对所述子集X1进行预聚类,得到由m个子簇构成的子簇集合C1;
步骤四、计算所述子簇集合C1中子簇间的簇间距离;
步骤五、根据所述簇间距离,合并簇间距离最小的子簇对,并更新该子簇对与其余子簇的簇间距离,重复合并与更新操作,直至获得包括K个子簇的子簇集合C2;
步骤六、对于所述子集X2中的数据,按最小距离依次划分至集合C2的各子簇中,完成分类。
3.如权利要2所述的一种分类方法,其特征在于,所述步骤二中利用数据在近邻关系上的活跃程度,将所述数据集X划分为两个具有不同分布特性的子集X1与X2,具体包括以下步骤:
计算所述数据集X中计算各数据间的欧氏距离
为所述数据集X中的每条数据xi寻找距离最近的k个近邻数据,这里,k取值等于10;
统计所述数据集X中每条数据xi在其它数据的k个近邻中出现的次数,记为H(xi),H(xj)表示数据xi在近邻关系上的活跃程度;
对所述数据集X中的所有数据按照其H(xi)值进行降序排序,取前80%的数据记为子集X1,其余的数据记为子集X2。
4.如权利要求3所述的一种分类方法,其特征在于,所述步骤三中利用最近邻关系对子集X1进行预聚类,得到由m个子簇构成的子簇集合C1,具体包括以下步骤:
为数据集X中的每条数据xi寻找距离最近的数据,记为
对于数据集X中的任一数据点对(xi,xj),如果满足和则将xi与xj合并至同一子簇;
利用最近邻关系,对数据集X中所有满足上述合并条件的数据点对进行合并操作,得到由m个子簇构成的子簇集合C1={c1,c2,L,cm}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海师范大学,未经上海师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010651577.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于磁性微模块的细胞培养方法
- 下一篇:一种超导新材料的制备方法