[发明专利]一种实现特征溯源的方法有效
申请号: | 202110107129.2 | 申请日: | 2021-01-27 |
公开(公告)号: | CN112836063B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 毛兴明 | 申请(专利权)人: | 四川新网银行股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/9038;G06F16/957;G06F16/901;G06F8/38;G06F16/28 |
代理公司: | 成都智言知识产权代理有限公司 51282 | 代理人: | 濮云杉 |
地址: | 610094 四川省成都市成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实现 特征 溯源 方法 | ||
本发明公开了一种实现特征溯源的方法,属于大数据技术领域,针对现有技术中各个部门独立进行特征开发,出现大量的特征被重复开发的现象,浪费了大量开发人员的时间,增加特征开发成本,造成大量人力、物力、财力的浪费的问题,本发明提出了技术方案,包括:构建实体节点和节点关系,并设置实体节点和节点关系的属性;将实体节点数据、节点关系数据、实体节点的属性数据和节点关系的属性数据导入图数据库,并设置通过查询功能对数据进行查询;基于图数据库,开发WEB页面用于提供特征的功能查询服务。其目的在于:以解决各个部门独立进行特征开发,出现大量的特征被重复开发的现象,以及大量人力、物力、财力的浪费的问题。本发明用于特征溯源。
技术领域
本发明属于大数据技术领域,具体涉及一种实现特征溯源的方法。
背景技术
随着科技的发展,大数据时代悄然而至,一些企业对于特征开发的需求也越来越大,特征开发的流程为:需求分析、代码开发、code review、数据自测。上线和历史数据跑批。
现有技术中,特征开发通过算法人员或者算法人员提交给数据仓人员来做,一些中大型企业由于特征开发的需求大,会存在着多个算法部门、多个算法研发人员以及模型需求多样化的情况。
现有技术存在以下问题:各个部门独立进行特征开发,出现大量的特征被重复开发的现象,浪费了大量开发人员的时间,增加特征开发成本,造成大量人力、物力、财力的浪费,并且企业规模越大,这种问题越明显。
发明内容
针对现有技术中各个部门独立进行特征开发,出现大量的特征被重复开发的现象,浪费了大量开发人员的时间,增加特征开发成本,造成大量人力、物力、财力的浪费的问题,本发明提供一种实现特征溯源的方法,其目的在于:以解决各个部门独立进行特征开发,出现大量的特征被重复开发的现象,避免出现浪费大量开发人员的时间,增加特征开发成本,以及大量人力、物力、财力的浪费的问题。
为了达到上述目的,本发明采用如下技术方案:
一种实现特征溯源的方法,包括:
步骤A:构建实体节点和节点关系,并设置实体节点和节点关系的属性;
步骤B:将实体节点数据、节点关系数据、实体节点的属性数据和节点关系的属性数据导入图数据库,并设置通过查询功能对数据进行查询;
本发明通过采用图数据库做数据存储,在面对特征溯源这类需要进行多度查询的问题时,其查询性能比普通关系数据库的性能高很多。
步骤C:基于图数据库,开发WEB页面用于提供特征的功能查询服务。
本发明采用知识图谱技术,对特征的实体、关系和属性的针对性设计。
进一步的,步骤A具体为:
步骤A1:对实体节点进行设置:所述实体节点包括特征表、特征和模型,所述特征表的属性包括:表名、表制作者姓名、表制作者联系方式;所述特征的属性包括:特征描述、特征开发者姓名、特征开发者联系方式;所述模型的属性包括模型名称、模型开发者姓名、模型开发者联系方式;
步骤A2:对节点关系进行设置,所述节点关系包括以下关系:
属于关系,特征与特征表的关系,指特征属于一特征表;
包含关系,特征表与特征的关系,指特征表包含了多个特征;
衍生关系,特征与特征的关系,指特征衍生出了多个特征;
使用关系,模型与特征的关系,指模型使用了多个特征。
进一步的,步骤B具体为:
步骤B1:将实体节点数据、节点关系数据、实体节点的属性数据和节点关系的属性数据导入neo4j图数据库;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川新网银行股份有限公司,未经四川新网银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110107129.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种机床切削液净化处理系统
- 下一篇:一种数据存储方法、装置及计算机设备