[发明专利]一种样本属性的分析方法、装置和设备有效
申请号: | 201310049899.1 | 申请日: | 2013-02-07 |
公开(公告)号: | CN103150349B | 公开(公告)日: | 2017-02-08 |
发明(设计)人: | 曹明;金中良 | 申请(专利权)人: | 华为软件技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司11138 | 代理人: | 鞠永善 |
地址: | 210012 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种样本属性的分析方法、装置和设备,属于数据分析领域。方法包括根据样本中样本属性的每个属性值的样本个数与样本总数得到每个属性值的样本占比Ri;对样本属性的所有属性值由小到大进行排列,得到样本属性的占比序列[R1、R2…Rn];将每个属性值的样本占比Ri依次与之前的属性值的样本占比R1、R2…Ri‑1累加,得到每个属性值的累计占比Wi;根据累计占比Wi和属性值个数n得到样本属性的强势值I,并将强势值I作为对样本属性进行分析的结果。本发明解决了目前样本属性的分析方法对分析人员要求高且主观性较强、处理效率低资源消耗大以及缺乏统一的评价依据的问题,提高了分析效率,降低了对分析人员的工作要求,统一了评价依据。 | ||
搜索关键词: | 一种 样本 属性 分析 方法 装置 设备 | ||
【主权项】:
一种计算机实现的对来源于数据库的样本属性进行分析的方法,其特征在于,所述方法包括:根据样本中样本属性的每个属性值的样本个数与样本总数得到所述每个属性值的样本占比Ri;根据所述每个属性值的样本占比Ri对所述样本属性的所有属性值由小到大进行排列,得到所述样本属性的占比序列[R1、R2…Rn];所述n为属性值个数;将每个属性值的样本占比Ri依次与所述每个属性值的样本占比Ri之前的属性值的样本占比R1、R2…Ri‑1累加,得到所述每个属性值的累计占比Wi;根据所述每个属性值的累计占比Wi和属性值个数n得到所述样本属性的强势值I,并将所述强势值I作为对所述样本属性进行分析的结果;其中,所述根据所述每个属性值的累计占比Wi和属性值个数n得到所述样本属性的强势值I,包括:根据公式计算得到所述样本属性的强势值I;其中,所述Wi为任一属性值i的累计占比,所述n为属性值个数,所述abs()为绝对值运算。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为软件技术有限公司,未经华为软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310049899.1/,转载请声明来源钻瓜专利网。