[发明专利]一种配资人资金账户识别及资金交易关系网络分析方法在审
申请号: | 202111548699.1 | 申请日: | 2021-12-17 |
公开(公告)号: | CN114372810A | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 胡芃;王冲;张林;张犇 | 申请(专利权)人: | 南京维数软件股份有限公司 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06Q40/04;G06K9/62;G06N20/00 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
地址: | 210000 江苏省南京市栖*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 配资人 资金 账户 识别 交易 关系 网络分析 方法 | ||
本发明提供配资人资金账户识别及资金交易关系网络分析方法,涉及证券犯罪嫌疑线索研判领域。该配资人资金账户识别及分析方法,包括以下步骤:S1.资金交易数据采集并标记;S2.资金数据清洗、补全、去重;S3.配资人资金特征选取;S4.有监督学习,确定最优分类模型;S5.配资人资金账户识别预测,并输出结果;S6.搭建资金关联模型,分析配资人资金交易网络关系;S7.将S5和S6过程输出结果进行智能比对分析,输出最终结果。配资人资金账户识别的判别过程:1)根据场景经验选取合适的数据特征变量;2)对选取的数据特征进行逻辑回归算法拟合;3)将预测的用户数据根据拟合的参数计算出分类的结果是真或是假。
技术领域
本发明涉及证券犯罪嫌疑线索研判领域,具体为配资人资金账户识别及资金交易关系网络分析 方法。
背景技术
传统的证券犯罪嫌疑资金数据分析主要采用单机版分析工具和excel,主要分为四步, 首先利用Excel计算各个资金账户交易次数、金额、时间等情况,然后将资金账户中交易 情况严重偏离平均水平的资金账户挑选出来,再通过人工对每个资金账户进行逐一分析判 断是配资人资金账户的可能性,最后利用人工对这些可疑的配资人资金账户逐层分析,查 找可疑资金网络关系。这样的识别及分析方式存在五个缺点:一是筛选标准较简单,资金 特征维度单一,特征间相互隔离,缺少很好的整合方式,二是具有主观性,对配资人资金 账户的识别完全依靠人工对每个资金账户进行逐一分析,没有量化标准,准确率低,推广 难度高,三是对资源投入要求高,由于第一步统计特征单一,没有很好的整合方式,对配 置人资金账户缺乏具体量化标准,因此大量的筛查识别分析工作遗留到了人工调查的阶 段,需要大量人力、物力、财力的投入,四是近几年大量涌向证券市场资金交易数据,规 模之大,速度之快历史罕见,资金交易数据来源多样,结构多样,没有统一标准,数据质 量参差不齐,很多核心字段存在缺项、漏项、存在特殊字符等问题,导致单机版工具无法支撑实际业务需求,五是证券案件专业性极强,严重缺乏业务能力过硬的专业人员,对于快速、准确、识别证券类案件配资人账户并分析出配资人资金交易网络关系变的尤为困难,严重制约了证券犯罪嫌疑研判工作效率和质量。
有监督学习作为机器学习领域中重要一种方式,如今已有很多成熟的有监督学习的成功案例可 以借鉴。
发明内容
针对现有技术的不足,本发明目的是,提出一种配资人资金账户识别及分析方法,有效的解决 了上述所存在的问题。尤其是利用机器学习方式,用已知某种或某些特性的样本作为训练集,以建 立一个数学模型,用已建立的模型来预测未知样本。
技术方案,为实现以上目的,本发明通过以下技术方案予以实现:配资人资金账户识别及分析 方法,包括以下步骤:
S1.资金交易数据采集并标记,资金交易数据来源多样,主要来源为反洗钱数据、所有银行数 据、银联数据等,并通过前端采集工具采集并存入大数据平台,同时对采集的数据进行标记,其中 标记包括配资人资金交易、非配资人交易;
S2.资金数据清洗、补全、去重,整个数据清洗原则包括全字段、全账单、全流程,按照“先 补全-再去重-可恢复-即反馈-再优化”流程,利用机器实现自动补全、去重、清洗,建立人工干预 机制,支持纠错反馈、数据恢复等功能,实现全面清洗数据。其中清洗包括通用清洗,例如全角转 半角、去空格、tab键、15位身份证转18位等,特性清洗是针对不同来源资金数据存在的问题进行 清洗,例如时间格式,特殊字符@等,规范内容,例如货币名称的统一、借贷标识统一等;补全,例 如补全资金数据中客户名称、证件号码、所属银行等;去重,例如全字段去重、核心字段去重、重 复上报去重等多种去重方式;
S3.配资人资金特征选取,特征包括资金交易总金额,阈值大于1000万,资金交易总次数,阈 值大于25,资金交易对手数量,阈值大于30,进出金额比例,阈值达到0.6,月交易总金额平均值, 阈值大于600万等;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京维数软件股份有限公司,未经南京维数软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111548699.1/2.html,转载请声明来源钻瓜专利网。