[发明专利]一种基于可加模型的多源异构数据融合架构系统有效
申请号: | 201711181949.6 | 申请日: | 2017-11-23 |
公开(公告)号: | CN107798137B | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 刘志强 | 申请(专利权)人: | 霍尔果斯智融未来信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q40/02 |
代理公司: | 北京精金石知识产权代理有限公司 11470 | 代理人: | 黄福伟 |
地址: | 100019 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模型 多源异构 数据 融合 架构 系统 | ||
本发明提供一种基于可加模型的多源异构数据融合架构系统,包括多源异构数据预处理模块、多源异构数据融合模块、模型加和模块。所述架构系统工作时,通过从预先创建的元模型库中调取匹配的元模型,能够对各种不同格式的数据进行处理,并通过模型加和部件实现数据融合。本发明可有效解决多源异构数据处理过程中容易出现的数据丢失、需根据数据源的格式与目标数据源格式做适配的问题,同时还能分析每个新加入的外部数据源对目标领域问题的贡献,能够实现海量异构数据的高速处理和分析。
技术领域
本发明涉及一种多源异构数据处理系统,具体涉及一种金融风控领域基于可加模型的多源异构数据融合架构系统,属于金融风控大数据处理领域。
背景技术
目前,随着我国金融业的发展,金融服务覆盖面逐渐扩大。对于有借贷需求的客户,银行通常会查询其之前的贷款记录,查询央行所储存的有关借贷人的信用记录,如贷款金额、次数、是否按时偿还等情况,同时还需要根据借贷人的年龄、职业、社保信息、收入、花销等各项资料分析借贷人的还款能力。随着金融业发展,尤其是互联网金融迅猛普及,有关借贷人信息资料的搜集将更全面、也更复杂。银行会搜集到与借贷人有关的海量的各种不同格式、不同来源的数据,而如何处理这些来源不同、格式各异的数据,并从中分析出借贷人将来的还款能力,是一大难题。
这些格式来源各异的数据称为多源异构数据,这些数据通常来自不同来源或者渠道,但表达的内容相似,以不同形式、不同来源、不同视角和不同背景等多种样式出现的数据。例如借贷人的年龄与收入,通常很难判断和比对。由于多源数据呈现出底层特征异构、高层语义相关的特性,传统的单源学习方法已无法适应多源数据的特性,因此,已经出现了一些针对多源异构数据的处理方法。
但是,目前存在的多源数据整合主要是建立外源数据与目标领域之间的桥梁,构建外源数据到目标领域的转化关系,进而解决目标领域的建模问题。这种做法主要有三个的缺点:1,在建立桥梁的过程中会有信息丢失;2,一般只解决两个领域之间的联合建模问题,无法自动整合多个数据源对目标领域问题的解释,很难衡量在给定条件下,新加入的外部数据对目标领域问题的贡献,现有技术中,通常采用先将不同的数据源格式转化后,整体打包再建模的方式,无法判断新加入的数据源对结果的贡献值;3,对不同领域的数据源的格式和生成逻辑有严格的要求,有多个外部数据源时,需要根据每个数据源自身的格式与目标数据源格式做适配。
中国发明专利(201310687009.X:多源异构数据高效汇聚存取架构系统)公开了一种多源异构数据高效汇聚存取架构系统,包括:多源异构数据协同管理子系统、多源异构数据高速缓存子系统、多源异构数据汇聚存储子系统,用于实现异构数据的高效汇聚存储。该发明虽然能够解决多源异构数据的存储问题,但不能实现对多源异构数据数据的分析处理,无法用于分析多源异构数据对设定目标变量的贡献。
中国发明专利(201310548861.9:一种多源异构电网运行参数分析系统)公开了一种多源异构电网运行参数分析系统,包括数据获取解析模块,多专业参数融合模块,专业参数质量分析模块。能够实现对各个专业电网参数的融合,并能计算各个专业电网参数之间的参数差异度,对参数进行质量分析及参数修正,该方法虽然能提高分析结果的准确性与可信性,但无法分析每一个参数对总体的贡献值。
发明内容
为解决现有技术中存在的问题,本发明提供了一种基于可加模型的多源异构数据融合架构系统,其特征在于,包括:
多源异构数据预处理模块、多源异构数据融合模块、模型加和模块;
所述多源异构数据预处理模块包括多源异构数据分类模块和多源异构数据提取模块,其中,多源异构数据分类模块用于对数据库中不同类型的数据进行分类,多源异构数据提取模块用于提取多源异构数据;
所述多源异构数据融合模块包括元模型调取模块和元模型部件,其中,所述元模型调取模块用于从预先创建的元模型库中调取与每个所述多源异构数据相匹配的元模型部件,所述元模型部件用于对多源异构数据进行处理,得到一个评分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于霍尔果斯智融未来信息科技有限公司,未经霍尔果斯智融未来信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711181949.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置