[发明专利]基于异构数据库的数据处理方法、系统、设备及存储介质在审

申请号：	202210840519.5	申请日：	2022-07-18
公开（公告）号：	CN115757567A	公开（公告）日：	2023-03-07
发明（设计）人：	杨灵芝;李悦;邓何;唐伟程;王芸	申请（专利权）人：	重庆银行股份有限公司
主分类号：	G06F16/25	分类号：	G06F16/25;G06N20/00
代理公司：	北京品源专利代理有限公司 11332	代理人：	李礼
地址：	400000***	国省代码：	重庆;50
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于数据库数据处理方法系统设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开一种基于异构数据库的数据处理方法、系统、设备及存储介质。该方法包括：获取至少一个源端的用户数据，基于预先配置的机器学习模型对用户数据进行处理以确定用户指标结果，根据用户指标结果和用户数据按照业务主题异步写入卡夫卡消息队列中，以使异构数据库集群按照配置的业务主题异步读取用户指标结果和用户数据。本发明实施例，通过预先配置的多种机器学习模型对用户数据进行处理以确定不同的用户指标结果，实现指标结果的多样性的指标确定；通过将用户指标结果和用户数据按照业务主题异步写入卡夫卡，使异构数据库集群按照业务主题异步读取数据，保障系统的高可用和可扩展，实现多重保障机制。

技术领域

本发明涉及计算机技术领域，尤其涉及一种基于异构数据库的数据处理方法、系统、设备及存储介质。

背景技术

现有指标计算系统，通常采用传统关系型数据库提供数据存储服务，用于指标计算的各数据源进入系统后，先存储在关系型数据库中，指标计算应用再读取源数据或辅助数据进行指标计算，指标计算的过程数据和最终结果，都持久化到关系型数据库中。此方法不支持多样性、实时性指标计算，存在数据库读取效率较低、应用和数据库之间存在网络延迟和瓶颈、数据库磁盘输入/输出瓶颈、关系型数据库分析计算能力差等缺点。

公开内容

有鉴于此，本发明提供一种基于异构数据库的数据处理方法、系统、设备及存储介质，保障系统的高可用和可扩展，实现多重保障机制。

根据本发明的一方面，本发明实施例提供了一种基于异构数据库的数据处理方法，该方法包括：

获取至少一个源端的用户数据；

基于预先配置的机器学习模型对所述用户数据进行处理以确定用户指标结果；

根据所述用户指标结果和所述用户数据按照业务主题异步写入卡夫卡消息队列中，以使异构数据库集群按照配置的所述业务主题异步读取所述用户指标结果和所述用户数据，其中，所述异构数据库集群至少两类数据库集群

根据本发明的另一方面，本发明实施例还提供了一种数据处理装置，该装置包括：

数据获取模块，用于获取至少一个源端的用户数据；

指标结果确定模块，用于基于预先配置的机器学习模型对所述用户数据进行处理以确定用户指标结果；

数据读取模块，用于根据所述用户指标结果和所述用户数据按照业务主题异步写入卡夫卡消息队列中，以使异构数据库集群按照配置的所述业务主题异步读取所述用户指标结果和所述用户数据，其中，所述异构数据库集群至少两类数据库集群。

根据本发明的另一方面，本发明实施例还提供了一种电子设备，所述电子设备包括：

至少一个处理器；以及