[发明专利]数据管理方法及装置在审
申请号: | 201910588376.1 | 申请日: | 2019-06-29 |
公开(公告)号: | CN110413600A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 张自豪 | 申请(专利权)人: | 万翼科技有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/245;G06F16/28 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 519000 广东省珠海市横琴新*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据管理系统 主数据 第一数据 数据管理 预处理 数据管理装置 数据共享 关系表 创建 | ||
1.一种数据管理方法,其特征在于,包括:
获取M1条第一数据和M2条第二数据,所述M1条第一数据为数据管理系统A中的数据,所述M2条第二数据为数据管理系统B中的数据,所述数据管理系统A和所述数据管理系统B为两个不同部门的系统;所述M1和M2均为大于或等于1的整数;
对所述M1条第一数据和M2条第二数据进行预处理,以得到M3条主数据,所述M3为大于或等于1且小于或者等于M1+M2的整数;
为所述M3条主数据中的每条主数据创建对应的标识,以得到主数据与标识的对应关系表。
2.根据权利要求1所述的方法,其特征在于,所述对所述M1条第一数据和M2条第二数据进行预处理,以得到M3条主数据,包括:
遍历所述M1条第一数据和所述M2条第二数据,判断所述M1条第一数据数和M2条第二数据中是否存在重复的数据;
若所述M1条第一数据中的任一数据D1和所述M2条第二数据中的任一数据D2为重复的数据,则保留所述数据D1和数据D2中的任一数据,将另一数据删除,以得到所述M3条主数据。
3.根据权利要求2所述的方法,其特征在于,所述判断所述M1条第一数据数和M2条第二数据中是否存在重复的数据,包括:
提取所述M1条第一数据中每条第一数据中的关键词,提取所述M2条第二数据中的每条第二数据中的关键词;
将所述数据D1中的关键词分别与所述数据D2中的关键词进行匹配;
若所述数据D1与所述数据D2中相匹配的关键词的数量大于预设阈值,则确定所述数据D1与所述数据D2为重复的数据。
4.根据权利要求2或3所述的方法,其特征在于,所述保留所述数据D1和数据D2中的任一数据,将另一数据删除,包括:
若所述数据管理系统A对应的部门的优先级高于所述数据管理系统B对应的部门的优先级,则保留所述数据D1,删除所述数据D2;
若所述数据管理系统A对应的部门的优先级低于所述数据管理系统B对应的部门的优先级,则保留所述数据D2,删除所述数据D1。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述为所述M3条主数据中的每条主数据创建对应的标识,包括:
获取所述M3条主数据中的每条主数据的主关键词,根据所述每条主数据的主关键词创建对应的第一标识;
若在所述M3条主数据中存在主关键词相同的主数据,则还获取主关键词相同的主数据的次要关键词,根据所述次要关键词获取对应主数据的第二标识。
6.一种数据管理装置,其特征在于,包括:
获取单元,用于获取M1条第一数据和M2条第二数据,所述M1条第一数据为数据管理系统A中的数据,所述M2条第二数据为数据管理系统B中的数据,所述数据管理系统A和所述数据管理系统B为两个不同部门的系统;所述M1和M2均为大于或等于1的整数;
预处理单元,用于对所述M1条第一数据和M2条第二数据进行预处理,以得到M3条主数据,所述M3为大于或等于1且小于或者等于M1+M2的整数;
创建单元,用于为所述M3条主数据中的每条主数据创建对应的标识,以得到主数据与标识的对应关系表。
7.根据权利要求6所述的装置,其特征在于,所述预处理单元具体用于:
遍历所述M1条第一数据和所述M2条第二数据,判断所述M1条第一数据数和M2条第二数据中是否存在重复的数据;
若所述M1条第一数据中的任一数据D1和所述M2条第二数据中的任一数据D2为重复的数据,则保留所述数据D1和数据D2中的任一数据,将另一数据删除,以得到所述M3条主数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于万翼科技有限公司,未经万翼科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910588376.1/1.html,转载请声明来源钻瓜专利网。