[发明专利]一种数据分布区间截取算法在审
申请号: | 201910757558.7 | 申请日: | 2019-08-16 |
公开(公告)号: | CN110457372A | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 李朋;高岩;王子彤;姜凯 | 申请(专利权)人: | 山东浪潮人工智能研究院有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06N3/04 |
代理公司: | 37100 济南信达专利事务所有限公司 | 代理人: | 郗艳荣<国际申请>=<国际公布>=<进入 |
地址: | 250100山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明特别涉及一种数据分布区间截取算法。该数据分布区间截取算法,由数据加载、数据排序、数据不同值个数及不同值对应的个数统计、区间选取及数据分布区间截取图绘制部分组成。该数据分布区间截取算法,通过对数据分布进行相对极值的求解,摒弃了数据分布的绝对最大值和最小值,从而得到数据较为集中的相对最大值与相对最小值,为一些数据的映射剔除了一些极端数据,能够准确截取数据聚集区间,保证了数据映射的可靠性,具有广泛的实用价值。 | ||
搜索关键词: | 数据分布 截取 算法 个数统计 极端数据 区间选取 数据加载 数据聚集 数据排序 数据映射 求解 映射 剔除 绘制 保证 | ||
【主权项】:
1.一种数据分布区间截取算法,其特征在于:由数据加载、数据排序、数据不同值个数及不同值对应的个数统计、区间选取及数据分布区间截取图绘制部分组成;具体包括以下步骤:/n第一步,数据加载负责将文档形式的数据加载到程序变量中;/n第二步,将加载的数据进行从小到大的数据排序,进而统计数据当中不同数值数据的个数以及每个数值的个数;/n第三步,以数值为横轴,对应的数值个数为纵轴,画出数值的分布直方图;/n第四步,根据需求选取分布中最集中的一个最大阈值Tmax和最小阈值Tmin,使得截取区间的点数在总点数length中占比P不小于阈值R;/n第五步,选取最大阈值Tmax和最小阈值Tmin差值最小的区间为最终截取区间,对应的最大阈值Tmax和最小阈值Tmin为最终的截取区间最大阈值Tmax和最小阈值Tmin。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮人工智能研究院有限公司,未经山东浪潮人工智能研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910757558.7/,转载请声明来源钻瓜专利网。