[发明专利]基于数据源多维特性的真值发现方法有效
申请号: | 201811053612.1 | 申请日: | 2018-09-11 |
公开(公告)号: | CN109284316B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 尹美娟;郑燕;刘晓楠;罗向阳;罗军勇;杨文 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 周艳巧 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于互联网数据挖掘技术领域,特别涉及一种基于数据源多维特性的真值发现方法,包含:量化对象实体中数据源之间的相关性;迭代:首先依据数据源之间的相关性及数据源准确率,获取每个对象实体中的副本数据并进行舍弃;然后,通过数据源准确率和召回率,推导数据源质量及对象真值;将满足迭代条件推导出的对象真值输出。本发明考虑数据源的准确率、召回率以及数据源之间的关系等多维特性,对数据源之间的关系进行量化表示,可准确识别出副本数据源,以减少副本数据源对融合结果的干扰;基于数据源准确率的基础中加入数据源的召回率,同时排除了副本数据源,推导出的数据源质量以及真值结果更准确,对互联网数据挖掘提取具有重要的指导意义。 | ||
搜索关键词: | 基于 数据源 多维 特性 真值 发现 方法 | ||
【主权项】:
1.一种基于数据源多维特性的真值发现方法,其特征在于,包含如下内容:量化对象实体中数据源之间的相关性;迭代:依据数据源之间的相关性及数据源准确率,获取每个对象实体中的副本数据并进行舍弃;通过数据源准确率和召回率,推导数据源质量及对象真值;将满足迭代收敛条件推导出的对象真值输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学,未经中国人民解放军战略支援部队信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811053612.1/,转载请声明来源钻瓜专利网。