[发明专利]基于Logistic回归的证券客户流失预测的方法及系统在审
申请号: | 201610149720.3 | 申请日: | 2016-03-16 |
公开(公告)号: | CN107203822A | 公开(公告)日: | 2017-09-26 |
发明(设计)人: | 李华明;蔡学范;李蔚敏;王雪峰 | 申请(专利权)人: | 上海吉贝克信息技术有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q40/04 |
代理公司: | 上海光华专利事务所31219 | 代理人: | 王再朝 |
地址: | 200093 上海市杨*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 logistic 回归 证券 客户 流失 预测 方法 系统 | ||
技术领域
本发明涉及证券领域,特别是涉及一种基于Logistic回归的证券客户流失预测的方法及系统。
背景技术
近几年来多数大的券商都已经实现了大集中或区域集中交易,以数据大集中方式在一定程度上可以为证券公司降低成本、加强风险管理,但如何以客户服务为中心提高利润率,如何更好地进行市场营销,如何进行产品创新,如何进行全面风险管理等问题,是无法通过数据大集中直接解决的。而这些问题又是目前证券公司在转折时期获得生存、赢取竞争优势必须面临的主要问题。而其中客户流失是证券行业普遍面临的业务问题,尤其在当前证券市场已步入成熟期的时候,竞争异常激烈。
传统的客户流失预测方法有经验预测方法和基于统计分析法。经验预测方法一般由决策者根据自己经验对客户进行流失预测划分,具有很强的主观性,结果不客观,缺少说服力,同时无法满足对大量客户进行实时判断的需求。基于统计方法的流失预测划分是一种量化研究,根据对客户属性特征统计结果进行客户流失预测,其结果往往与分类标准具有极强的关联性,如果分类标准不合理,预测结果也不合理。随着我国证券信息化建设的不断深入,券商已经积累了大量的个人历史交易数据和客户资料,面对海量的客户信息,传统的客户流失预测方法显得力不从心。
近年来,数据挖掘技术得到了迅速的发展,其融合了数据库、人工智能、和统计学等多个领域技术,能够从大量的、不完全的、有噪声的、模糊的原始数据中,挖掘出有用、可信、新颖的信息和知识的过程。数据挖掘领域中预测模型常见神经网络和决策树。采用决策树模型的券商客户基本交易数据基本都采用了连续变量分箱来处理连续变量的非线性问题,获取的结果不够准确;神经网络模型的结果为黑匣子,不利于模型的解释和应用。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于Logistic回归的证券客户流失预测的方法及系统,用于解决现有技术中不能准确客观的预测证券客户流失的问题。
为实现上述目的及其他相关目的,本发明提供一种基于Logistic回归的证券客户流失预测方法,包括以下步骤:确定客户流失指标和数据范围;根据客户流失指标和数据范围筛选客户数据;根据筛选出的所述客户数据计算初始变量;对所述初始变量进行预处理;根据所述预处理后的初始变量,通过logistic回归模型对客户流失进行预测计算,以获得流失概率大于预设流失概率阈值的客户列表。
于本发明的一具体实施例中,所述客户流失指标至少包括以下中的一种:客户在一预设时间段内的亏损率、客户的交易量和交易额、客户资金的净流入、客户日均资产的萎缩情况、客户的日均持仓市值情况、客户的佣金率、以及客户获得的服务次数。
于本发明的一具体实施例中,所述数据范围包括时间范围和客户范围;所述时间范围包括预测时间之前的第一时间段以及预测时间之后的第二时间段,其中,所述预测方法用以筛选所述第一时间段内的客户数据,且,所述预测方法用以预测所述第二时间段内的客户流失率;所述客户范围至少排除以下中的一种或多种:资产小于一第一资产阈值的客户、机构客户、资产大于一第二资产阈值的客户、开户时间小于一时间阈值的客户、无交易行为的客户、在所述第一时间段内已经流失的客户。
于本发明的一具体实施例中,所述对所述初始变量进行预处理的操作包括:缺失值填充以及极值处理。
于本发明的一具体实施例中,在计算出所述初始变量后,根据以下中的一种或多种指标对所述初始变量进行衍生:资产总量、佣金、仓位、交易活跃度、资金流入量、资金流出量、盈亏比例、以及产品信息。
为实现上述目的及其他相关目的,本发明还提供一种基于Logistic回归的证券客户流失预测系统,包括:确定模块,确定客户流失指标和数据范围;数据筛选模块,用以根据客户流失指标和数据范围筛选客户数据;初始变量计算模块,用以根据筛选出的所述客户数据计算初始变量;预处理模块,用以对所述初始变量进行预处理;预测模块,根据所述预处理后的初始变量,通过logistic回归模型对客户流失进行预测计算,以获得流失概率大于预设流失概率阈值的客户列表。
于本发明的一具体实施例中,所述客户流失指标至少包括以下中的一种:客户在一预设时间段内的亏损率、客户的交易量和交易额、客户资金的净流入、客户日均资产的萎缩情况、客户的日均持仓市值情况、客户的佣金率、以及客户获得的服务次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海吉贝克信息技术有限公司,未经上海吉贝克信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610149720.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电动二轮车
- 下一篇:一种改进双撑架的电动车
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理