[发明专利]数据处理方法和装置在审
申请号: | 201710504109.2 | 申请日: | 2017-06-27 |
公开(公告)号: | CN107368918A | 公开(公告)日: | 2017-11-21 |
发明(设计)人: | 朱洁;孙舟;王伟贤;张禄;潘鸣宇;田贺平;李香龙 | 申请(专利权)人: | 国网北京市电力公司;国家电网公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q50/06 |
代理公司: | 北京康信知识产权代理有限责任公司11240 | 代理人: | 赵囡囡,褚敏 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 | ||
技术领域
本发明涉及数据处理领域,具体而言,涉及一种数据处理方法和装置。
背景技术
随着数字信息化时代的到来,全球数字信息资源进入了一个前所未有的快速增长期,大数据浪潮已冲击渗透到各个行业,成为重要的生产因素。近几年,电力行业信息化建设不断深入,积累了体量客观的数据资源,其潜藏的巨大价值得到了业内专家的一致认可,这些数据资源将成为电力行业提高生产力水平、实现能源互联网、建设智能电网的关键生产要素。电力用户种类复杂,有大工业用电、一般农业用电、居民用电等,客户拖欠电费及其潜在的坏账风险已经成为困扰供电企业经营和发展的重要问题。传统的电力企业管理往往依靠前人经验应对复杂问题。然而,随着智能电网不断发展,电网信息化水平不断提升,电网运营产生的数据呈指数级增长,电网已经进入大数据的时代,依靠传统的方法已经无法应对海量数据。自动抄表虽然实现了用户用电量的及时读取,但却没有对用户的缴费与欠费情况进行预警,仍会出现由于用户疏忽等原因导致欠费的情况,因此急需一种欠费预警系统预计用户的欠费风险,以尽量减小欠费对供电企业造成的损失。
针对相关技术中无法准确的预计用户的欠费风险的技术问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种数据处理方法和装置,以至少解决相关技术中无法准确的预计用户的欠费风险的技术问题。
根据本发明实施例的一个方面,提供了一种数据处理方法,该方法包括:获取用电数据库中的历史用电数据,其中,历史用电数据包括用电用户的属性参数以及用电行为参数或缴费行为参数;将用电数据库中的用电用户按照所处行业进行分类,得到多个类别的用电用户;根据历史用电数据分别对每个类别的用电用户进行建模,得到欠费风险模型,其中,欠费风险模型用于表示每个类别的用电用户的属性参数、用电行为参数以及缴费行为参数与欠费风险参数之间的关系。
进一步地,获取用电数据库中的历史用电数据包括:在用电用户的属性参数中确定用户标识参数;基于用户标识参数在用电数据库中随机抽取数据,得到建模集和评分集,根据历史用电数据分别对每个类别的用电用户进行建模包括:采用多种模型根据建模集分别对每个类别的用电用户进行建模;通过评分集对每个类别的用电用户的多个欠费风险模型进行评分;确定评分最高的欠费风险模型为对应类别的欠费风险模型。
进一步地,建模集包括训练集、验证集和测试集,多种模型包括第一模型,多个类别的用电用户包括第一类别的用电用户,采用多种模型根据建模集分别对每个类别的用电用户进行建模包括:通过训练集训练第一类别的第一模型,并在训练过程中通过验证集纠正第一模型的过拟合程度;通过测试集测试训练结束后的第一模型,得到测试结果;判断测试结果是否符合预设条件;如果判断结果为否,则再次在用电数据库中随机抽取数据,得到新的建模集,并根据新的建模集对训练结束后的第一模型进行测试,直至测试结果符合预设条件。
进一步地,获取用电数据库中的历史用电数据包括:通过多个用电数据平台获取多个用电数据表;去除多个用电数据表中的用户隐私信息;将多个用电数据表进行拼接,其中,如果判断出多个用电数据表中存在重复的属性参数、用电行为参数或缴费行为参数,则将重复的属性参数、用电行为参数或缴费行为参数进行合并。
根据本发明实施例的另一方面,还提供了一种数据处理装置,该装置包括:获取单元,用于获取用电数据库中的历史用电数据,其中,历史用电数据包括用电用户的属性参数以及用电行为参数或缴费行为参数;分类单元,用于将用电数据库中的用电用户按照所处行业进行分类,得到多个类别的用电用户;建模单元,用于根据历史用电数据分别对每个类别的用电用户进行建模,得到欠费风险模型,其中,欠费风险模型用于表示每个类别的用电用户的属性参数、用电行为参数以及缴费行为参数与欠费风险参数之间的关系。
进一步地,获取单元包括:第一确定模块,用于在用电用户的属性参数中确定用户标识参数;抽取模块,用于基于用户标识参数在用电数据库中随机抽取数据,得到建模集和评分集,建模单元包括:建模模块,用于采用多种模型根据建模集分别对每个类别的用电用户进行建模;评分模块,用于通过评分集对每个类别的用电用户的多个欠费风险模型进行评分;第二确定模块,用于确定评分最高的欠费风险模型为对应类别的欠费风险模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网北京市电力公司;国家电网公司,未经国网北京市电力公司;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710504109.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理