[发明专利]大量个体的数据趋势分析方法、电子设备和计算机存储介质在审
申请号: | 201711483421.4 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108564390A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 叶梦晴;杨帆;刘丹 | 申请(专利权)人: | 广东金赋科技股份有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 北京易捷胜知识产权代理事务所(普通合伙) 11613 | 代理人: | 韩国胜 |
地址: | 528200 广东省佛山市南海区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据趋势 计算机存储介质 电子设备 二维聚类 聚类结果 分析 决策 | ||
1.一种大量个体的数据趋势分析方法,其特征在于,所述方法,包括:
S101,获取每个个体的多个有序数据;
S102,根据每个个体的多个有序数据,确定每个个体的斜率和确定系数;
S103,对每个个体的斜率和确定系数进行二维聚类;
S104,根据聚类结果分析每个个体的趋势。
2.根据权利要求1所述的方法,其特征在于,所述S101之后,S102之前,还包括:
将每个个体的多个有序数据案子相同的方式进行排序。
3.根据权利要求2所述的方法,其特征在于,所述S102具体包括:
对每个个体排序后的有序数据进行线性拟合,得到每个个体的斜率和确定系数。
4.根据权利要求3所述的方法,其特征在于,所述S103具体包括:
S103-1,对每个个体的斜率进行排序,选择位于排序中间的第一预设数量个个体;
S103-2,将选择的个体的斜率进行归一化操作;
S103-3,对选择的个体的归一化后的斜率和确定系数进行二维聚类。
5.根据权利要求4所述的方法,其特征在于,所述S103-3具体包括:
S103-3-1,随机选取第二预设数量个初始中心点;
S103-3-2,遍历所有选择的个体,根据每个选择的个体的归一化后的斜率和确定系数,将每个选择的个体划分到最近的初始中心点所处的类别中;
S103-3-3,计算划分后的各类的平均值,将所述平均值作为各类的新中心点;
S103-3-4,若存在任一类的新中心点与初始中心点的偏差大于预设阈值,则将各类的新中心点作为初始中心点,重复执行S103-3-2和S103-3-3,直至各类新中心点与初始中心点的偏差均不大于预设阈值。
6.根据权利要求5所述的方法,其特征在于,所述S103-3-4之后,还包括:
S103-3-5,计算每个类别的第一标准差;
S103-3-6,将所有未选择的个体的斜率进行归一化操作;
S103-3-7,遍历所有未选择的个体,根据每个未选择的个体的归一化后的斜率和确定系数,计算每个未选择的个体到各类别的新中心点的距离以及每个未选择的个体划分到各类别后,各类别的第二标准差;
S103-3-8,针对每个未选择的个体,计算各类别的第二标准差-第一标准差的值Δσ;
S103-3-9,对于任一未选择的个体,若存在一个最佳类别,则将所述任一未选择的个体划分到所述最佳类别中,所述最佳类别为:所述任一未选择的个体到该最佳类别的新中心点的距离最近,并且,所述任一未选择的个体划分到该最佳类别后的Δσ最小;
S103-3-10,对于任一未选择的个体,若不存在最佳类别,则按所述任一未选择的个体到该各类别的新中心点的距离从近到远依次选择一个类别,若所述任一未选择的个体划分到选择的类别后的Δσ<所述任一未选择的个体划分到各类别后的Δσ均值,则将所述任一未选择的个体划分到选择的类别中。
7.根据权利要求6所述的方法,其特征在于,所述第二预设数量为大于5的整数;
所述第一预设数量为S101中获取的个体数量*0.9的下取整。
8.根据权利要求7所述的方法,其特征在于,所述S104具体包括:
将各类的趋势作为各类中每个个体的趋势。
9.一种电子设备,其特征在于,包括存储器、处理器、总线以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-8任意一项的步骤。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于:所述程序被处理器执行时实现如权利要求1-8任意一项的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东金赋科技股份有限公司,未经广东金赋科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711483421.4/1.html,转载请声明来源钻瓜专利网。