[发明专利]一种评估数据的可信度的方法及装置在审
申请号: | 201611229088.X | 申请日: | 2016-12-27 |
公开(公告)号: | CN108255788A | 公开(公告)日: | 2018-07-06 |
发明(设计)人: | 李欣;邓丽;王生;王伟 | 申请(专利权)人: | 方正国际软件(北京)有限公司;方正国际软件有限公司 |
主分类号: | G06F17/18 | 分类号: | G06F17/18 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据源 字段 矩阵 可信度 可信度评估 矩阵相乘 冲突 可信度系数 结果矩阵 评估数据 数据可信度 冲突数据 评估结果 集合 | ||
1.一种评估数据可信度的方法,其特征在于,该方法包括:
获取N个数据源的冲突数据集合,其中,各个数据源包含相同对象的相同字段,且所述冲突数据集合中每至少两个冲突数据归属于同一对象的同一字段;
针对所述冲突数据集合中的第一对象的第一冲突字段的每个冲突数据,确定每个冲突数据的可信度,并从各个冲突数据的可信度中,选择可信度最大值作为所述第一对象的所述第一冲突字段的可信度系数,其中,所述第一对象为任意一个对象,所述第一冲突字段为所述冲突数据集合对应的M个冲突字段中的任意一个;
针对N个数据源所对应的第一对象的第一冲突字段,根据各个数据源中所述第一冲突字段对应的数据的相似性,确定N个数据源两两之间的相关性系数,并生成关于所述第一冲突字段的相关性矩阵;
用所述可信度系数与所述相关性矩阵相乘,得到所述第一冲突字段的可信度评估矩阵;
依照所述第一对象的第一冲突字段的可信度评估矩阵计算方法,计算得到每个对象的每个冲突字段的可信度评估矩阵;
将每个对象的每个冲突字段的可信度评估矩阵相乘得到的N行N列的结果矩阵,将所述N行N列的结果矩阵与所述N个数据源的初始可信度对应的N行1列矩阵相乘,得到所述N个数据源的N行1列的评估结果矩阵,其中,所述评估结果矩阵每一行的值为所述该行对应的数据源的可信度评估结果。
2.如权利要求1所述的方法,其特征在于,所述针对所述冲突数据集合中的第一对象的第一冲突字段的每个冲突数据,确定每个冲突数据的可信度,包括:
确定与每个冲突数据均相关的多个可信度评价因素;
针对所述冲突数据集合中的第一对象的第一冲突字段的第一冲突数据对应的第一可信度评价因素,确定所述第一冲突数据与所述第一可信度评价因素相关的第一权重,并确定所述第一冲突数据对应的所述第一可信度评价因素的第一统计值,其中,所述第一冲突数据为任意一个冲突数据,所述第一可信度评价因素为任意一个可信度评价因素;
将所述第一权重与所述第一统计值相乘得到所述所述第一冲突数据的第一参考可信度;
将所述第一冲突数据对应的各个可信度评价因素的参考可信度求和,得到所述第一冲突数据的可信度。
3.如权利要求2所述的方法,其特征在于,所述将所述第一冲突数据对应的各个可信度评价因素的参考可信度求和,得到所述第一冲突数据的可信度包括:
所述多个可信度评价因素包含时间因素、次数因素、数据规范性因素;
按照公式一将所述时间因素的统计值、所述次数因素的统计值和所述数据规范性因素的统计值组成的第一矩阵与第二矩阵相乘,得到所述第一冲突数据的可信度,其中所述第二矩阵为所述时间因素的权重、所述次数因素的权重和所述数据规范性因素的权重组成的,所述公式一为:
其中,所述α为时间因素的统计值、β为次数因素的统计值、γ为数据规范性因素的统计值,q1为时间因素的权重,q2为次数因素的权重,q3数据规范性因素的权重。
4.如权利要求1所述的方法,其特征在于,将每个对象的每个冲突字段的可信度评估矩阵相乘得到的N行N列的结果矩阵,将所述N行N列的结果矩阵与所述N个数据源的初始可信度对应的N行1列矩阵相乘,得到所述N个数据源的N行1列的评估结果矩阵,包括:
按照公式二计算得到所述N个数据源的N行1列的评估结果矩阵,所述公式二为:
其中,x1为第一个数据源的可信度评估结果,x2为第二个数据源的可信度评估结果,xn为第n个数据源的可信度评估结果,λ1为第p个对象的第一冲突字段的可信度系数,λε为第p个对象的第ε冲突字段的可信度系数,其中,ε不大于m,P的范围从1至t,t为对象的总数,ω1为第一个数据源的初始可信度结果,ω2为第二个数据源的初始可信度结果,ωn为第n个数据源的初始可信度结果,u12为第一个数据源和第二数据源之间关于第p对象的第一字段的相关性系数,其它以此类推,v12为第一个数据源和第二数据源之间关于第p对象的第m字段的相关性系数,其它以此类推。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于方正国际软件(北京)有限公司;方正国际软件有限公司,未经方正国际软件(北京)有限公司;方正国际软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611229088.X/1.html,转载请声明来源钻瓜专利网。