[发明专利]一种金融风险控制知识图谱的构建方法在审

申请号：	201811223568.4	申请日：	2018-10-19
公开（公告）号：	CN109522416A	公开（公告）日：	2019-03-26
发明（设计）人：	王涛;李嘉正;程良伦	申请（专利权）人：	广东工业大学
主分类号：	G06F16/36	分类号：	G06F16/36;G06F17/27;G06F16/901;G06N5/02
代理公司：	广州粤高专利商标代理有限公司 44102	代理人：	林丽明
地址：	510006 广东省***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	风险控制图谱构建金融数据金融实体间关系采集数据分词处理高效识别金融欺诈金融资料目标实体爬虫技术图谱构建整合置信引擎抽取数据库存储欺诈转化案件网络
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种金融风险控制知识图谱构建方法，通过爬虫技术对金融资料采集数据，进行分词处理；利用深度置信网络从金融数据中抽取知识，包括实体和实体间关系和属性；将所述目标实体作为知识图谱节点，得到金融风险控制知识图谱并存储在Neo4j图数据库中。本发明能够充分利用从数据到知识的持续转化，通过金融风险控制知识图谱的构建快速把不同来来源的金融数据整合在一起，并构建反欺诈引擎，快速高效识别金融欺诈案件。

技术领域

本发明涉及金融领域，更具体地，涉及一种金融风险控制知识图谱的构建方法。

背景技术

知识图谱以符号形式描述物理世界中的概念及其相互关系，其基本组成单位是“实体－关系－实体”三元组，以及实体及其相关属性-值对，实体间通过关系相互联结，构成网状的知识结构。知识图谱遵循 RDF 数据模型，包含数以千万级或者亿级规模的实体，以及数十亿或百亿事实（即属性值和与其他实体的关系），并且这些实体被组织在成千上万的由语义类体现的客观世界的概念结构中。知识图谱，作为关系的直接表示方式，提供非常便捷的方式来添加新的数据源。而且，知识图谱本身就是用来表示关系的，这种直观的表示方法可以帮助我们更有效地分析复杂关系中存在的特定的潜在风险。

反欺诈是风控中非常重要的一道环节。基于大数据的反欺诈的难点在于如何把不同来源的数据（结构化，非结构）整合在一起，并构建反欺诈引擎，来有效地识别出欺诈案件。而且不少欺诈案件会涉及到复杂的关系网络，这也给欺诈审核带来了新的挑战。

发明内容

为了解决现有技术中大数据的反欺诈手段无法把不同来源的数据整合在一起的不足，本发明提供了一种金融风险控制知识图谱的构建方法。

为实现以上发明目的，采用的技术方案是：

一种金融风险控制知识图谱的构建方法，包括以下步骤：

步骤 S1：通过爬虫技术对金融资料采集数据，并进行分词处理；

步骤S2：对经过处理的数据利用深度置信网络进行知识抽取，知识抽取包括实体、实体间关系以及实体的属性的抽取；

步骤S3：将知识抽取的结果数据作为知识图谱中的节点，构建金融风险控制知识图谱；

步骤 S4：将构建的所述医疗知识图谱存储在Neo4j图数据库中。

优选的，步骤S1具体包括以下步骤：

步骤S101：通过网络信息获取的爬虫技术从金融资料中采集数据，数据信息内容包括向人的电话、消费记录、行为记录、同事信息；

步骤S102：对数据进行预处理，使用自然语言技术进行分词、词性的标注及句法分析处理；