[发明专利]高可信度使用数据集的方法和系统有效

专利信息
申请号: 200680036951.8 申请日: 2006-08-03
公开(公告)号: CN101278291A 公开(公告)日: 2008-10-01
发明(设计)人: 苏瑞什·格帕兰 申请(专利权)人: 苏瑞什·格帕兰
主分类号: G06F17/30 分类号: G06F17/30;G01L17/00;G06K9/00
代理公司: 北京连和连知识产权代理有限公司 代理人: 张春媛
地址: 美国马*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 可信度 使用 数据 方法 系统
【权利要求书】:

1.一种处理数据的方法,该方法包含步骤:

选择用于确定数据集中真阳性和假阳性的充分最优化组合度量的标准;

应用最优化技术,并且

从最优化技术的结果中获得用于至少一个最优化参数的值,所述用于至少一个最优化参数的值得到真阳性和假阳性的充分最优化组合;

其特征是,真阳性的数目和假阳性的数目是至少一个最优参数的函数。

2.根据权利要求1所述的方法,其特征在于所述用于获得至少一个最优化参数的步骤包含获得独立测量数目的值的步骤:以及其中所述的真阳性和假阳性的数目是独立测量数目的函数。

3.根据权利要求1所述的方法,其特征在于所述获得独立测量数目的值的步骤包含获得至少一个独立测量数目的值和用于置信测量的值的组合的步骤;以及

其中所述真阳性和假阳性的数目是至少一个独立测量数目和置信测量的组合的函数。

4.根据权利要求1所述的方法,其特征在于所述的标准由下式给出

Neff=TP*TP/(TP+FP)*(1-FP/TP)

其中,TP表示数据集里真阳性的值,以及FP表示数据集里假阳性的值。

5.根据权利要求1所述的方法,其特征在于所述的应用最优化技术的步骤包含最优化成本函数的步骤。

6.根据权利要求5所述的方法,其特征在于所述的成本函数由下式给出

CANeff=Neff/(F′+N1);

其中F′是置信阈值测量,N′是用于独立测量数目的值的阈值,以及Neff是标准。

7.根据权利要求2所述的方法,其特征在于进一步包含步骤:

a)为独立测量数目的值选择预先确定的阈值的原始值;

b)选择数据集的一个元素;数据集包含较多数目的元素;

c)为选出的一个元素确定至少一个预定数量;

d)确定所述的至少一个预定数量是否满足阈值标准;

e)如果所述的至少一个预定数量满足阈值标准,增加元素的数目;

f)增加元素的数目之后,确定元素的数目是否大于用于独立测量的数目的值的阈值;

g)用于较大数目的元素中的每一个元素,经由步骤f)重复步骤b);

h)用步骤c)确定用于独立测量的数目的值的阈值是否得到真阳性和假阳性的充分最优化的组合;

8.根据权利要求7所述的方法,其特征在于所述的数据集包括用于一个元素的至少两个参数;以及该方法进一步包含对于每一个参数完成步骤f)前重复步骤d)和e)的步骤。

9.根据权利要求7所述的方法,其特征在于所述的数据集包括重复;以及该方法进一步包含步骤:

i)在步骤b)之前,选择预先确定的置信阈值测量的原始值;

j)步骤d)之后,如果所述的至少一个预先确定的数量满足阈值标准,为所属的此个元素计算置信测量;

k)确定计算的置信测量是否大于置信阈值测量;

l)对较大数目的元素里的每一个元素进行步骤e);

m)步骤h)后,在预先确定的置信阈值范围内的置信阈值测量;

以及

其中,步骤d)进一步包含经由步骤l)重复步骤j);以及

其中,步骤h)进一步包含对得到真阳性和假阳性充分最优化的组合的置信阈值测量的选择。

10.根据权利要求9所述的方法,其特征在于所述的数据集包括用于至少一些元素的至少两个参数;以及该方法进一步包含在完成步骤f)之前,对各个参数重复步骤d)和e)的步骤。

11.根据权利要求7所述的方法,其特征在于所述的用于预先确定的数量的阈值由下列步骤确定:

在至少一部分数据集上评估预定数量;

以数值的升序排列评估的预定数量;

选择预定数量的预定百分位数作为用于预定数量的阈值。

12.根据权利要求11所述的方法,其特征在于所述的预定数量是数据集的两个元素之间数字的差异。

13.根据权利要求11所述的方法,其特征在于所述的预定数量是数据集的两个元素间的比值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏瑞什·格帕兰,未经苏瑞什·格帕兰许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200680036951.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top