[发明专利]一种信息管理方法及装置在审
申请号: | 201811642530.0 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109684533A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 韩博文;王旸;冯兴;华锦芝;朱新新;郑景飞;徐晋耀 | 申请(专利权)人: | 中国银联股份有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/958 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 200135 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 第一数据 源信息 被管理对象 候选信息 补充信息 相似度 信息管理 数据处理技术 数据源信息 最终信息 数据源 匹配 | ||
本发明实施例涉及数据处理技术领域,尤其涉及一种信息管理方法及装置,用以对被管理对象的信息进行完善,提升了信息的数据质量。本发明实施例包括:从第一数据源中获取被管理对象的第一数据源信息;根据所述第一数据源信息,从第二数据源中匹配出N个第二数据源信息,作为N个候选信息;计算所述第一数据源信息与每一条候选信息的相似度,将相似度大于第一阈值的M个候选信息作为M个补充信息,其中M≤N;根据所述M个补充信息以及所述第一数据源信息,确定所述被管理对象的最终信息。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种信息管理方法及装置。
背景技术
商户在金融行业中最重要的资源和服务对象之一,商户信息是收单侧业务开展的重要基础。提供内容完备、质量可靠的商户数据信息,有助于市场拓展、提升商户服务能力、护航银联长期发展。
近年来,由于受理市场违规行为多发、银联对商户直接管控力度弱等多种原因,使得银联商户基础信息中的虚假、缺失、散乱等问题普遍存在且日益突出。如何推进商户信息的治理工作,构建真实好用的商户基础信息库成为亟待解决的问题。
发明内容
本申请提供一种信息管理方法及装置,用以对被管理对象的信息进行完善,提升了信息的数据质量。
本发明实施例提供的一种信息管理方法,包括:
获取被管理对象的第一数据源信息;所述第一数据源信息为所述被管理对象在第一数据源中的信息;
根据所述第一数据源信息,从第二数据源中匹配出N个第二数据源信息,作为N个候选信息;
计算所述第一数据源信息与每一条候选信息的相似度,将相似度大于第一阈值的M个候选信息作为M个补充信息,其中M≤N;
根据所述M个补充信息以及所述第一数据源信息,确定所述被管理对象的最终信息。
一种可选的实施例中,所述根据所述M个补充信息以及所述第一数据源信息,确定所述被管理对象的最终信息,包括:
对所述M个补充信息和所述第一数据源信息分别进行可信度打分;
根据每个补充信息的可信度分数,以及所述第一数据源信息的可信度分数,确定所述被管理对象的最终信息。
一种可选的实施例中,所述根据所述第一数据源信息,从第二数据源中匹配出N个第二数据源信息,作为N个候选信息,包括:
从所述第一数据源信息中确定出P个关键词;
针对一个第二数据源信息,根据所述P个关键词在所述第二数据源信息中出现的个数,以及每个关键词在所述第二数据源中的词频,计算出所述第二数据源信息与所述第一数据源信息的匹配度;
将与所述第一数据源信息的匹配度大于第二阈值的第二数据源信息作为候选信息。
一种可选的实施例中,所述计算所述第一数据源信息与每一条候选信息的相似度,将相似度大于第一阈值的M个候选信息作为M个补充信息,包括:
确定所述被管理对象的Q个信息维度;
针对一个信息维度,从所述第一数据源信息中提取出第一维度信息,从N个候选信息中提取出N个第二维度信息,分别计算每个第二维度信息与所述第一维度信息的相似度;
针对每个候选信息,依据所述候选信息的Q个第二维度信息与所述第一维度信息的相似度,计算出所述候选信息与所述第一数据源信息的综合相似度;
与所述第一数据源信息的综合相似度大于所述第一阈值的M个候选信息作为补充信息。
一种可选的实施例中,所述根据所述M个补充信息以及所述第一数据源信息,确定所述被管理对象的最终信息之后,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811642530.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于案例集的法律咨询服务系统
- 下一篇:基于符号识别的智能检索方法及装置