[发明专利]数据处理方法和装置在审

专利信息
申请号: 201710504109.2 申请日: 2017-06-27
公开(公告)号: CN107368918A 公开(公告)日: 2017-11-21
发明(设计)人: 朱洁;孙舟;王伟贤;张禄;潘鸣宇;田贺平;李香龙 申请(专利权)人: 国网北京市电力公司;国家电网公司
主分类号: G06Q10/04 分类号: G06Q10/04;G06Q10/06;G06Q50/06
代理公司: 北京康信知识产权代理有限责任公司11240 代理人: 赵囡囡,褚敏
地址: 100031 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据处理 方法 装置
【说明书】:

技术领域

发明涉及数据处理领域,具体而言,涉及一种数据处理方法和装置。

背景技术

随着数字信息化时代的到来,全球数字信息资源进入了一个前所未有的快速增长期,大数据浪潮已冲击渗透到各个行业,成为重要的生产因素。近几年,电力行业信息化建设不断深入,积累了体量客观的数据资源,其潜藏的巨大价值得到了业内专家的一致认可,这些数据资源将成为电力行业提高生产力水平、实现能源互联网、建设智能电网的关键生产要素。电力用户种类复杂,有大工业用电、一般农业用电、居民用电等,客户拖欠电费及其潜在的坏账风险已经成为困扰供电企业经营和发展的重要问题。传统的电力企业管理往往依靠前人经验应对复杂问题。然而,随着智能电网不断发展,电网信息化水平不断提升,电网运营产生的数据呈指数级增长,电网已经进入大数据的时代,依靠传统的方法已经无法应对海量数据。自动抄表虽然实现了用户用电量的及时读取,但却没有对用户的缴费与欠费情况进行预警,仍会出现由于用户疏忽等原因导致欠费的情况,因此急需一种欠费预警系统预计用户的欠费风险,以尽量减小欠费对供电企业造成的损失。

针对相关技术中无法准确的预计用户的欠费风险的技术问题,目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种数据处理方法和装置,以至少解决相关技术中无法准确的预计用户的欠费风险的技术问题。

根据本发明实施例的一个方面,提供了一种数据处理方法,该方法包括:获取用电数据库中的历史用电数据,其中,历史用电数据包括用电用户的属性参数以及用电行为参数或缴费行为参数;将用电数据库中的用电用户按照所处行业进行分类,得到多个类别的用电用户;根据历史用电数据分别对每个类别的用电用户进行建模,得到欠费风险模型,其中,欠费风险模型用于表示每个类别的用电用户的属性参数、用电行为参数以及缴费行为参数与欠费风险参数之间的关系。

进一步地,获取用电数据库中的历史用电数据包括:在用电用户的属性参数中确定用户标识参数;基于用户标识参数在用电数据库中随机抽取数据,得到建模集和评分集,根据历史用电数据分别对每个类别的用电用户进行建模包括:采用多种模型根据建模集分别对每个类别的用电用户进行建模;通过评分集对每个类别的用电用户的多个欠费风险模型进行评分;确定评分最高的欠费风险模型为对应类别的欠费风险模型。

进一步地,建模集包括训练集、验证集和测试集,多种模型包括第一模型,多个类别的用电用户包括第一类别的用电用户,采用多种模型根据建模集分别对每个类别的用电用户进行建模包括:通过训练集训练第一类别的第一模型,并在训练过程中通过验证集纠正第一模型的过拟合程度;通过测试集测试训练结束后的第一模型,得到测试结果;判断测试结果是否符合预设条件;如果判断结果为否,则再次在用电数据库中随机抽取数据,得到新的建模集,并根据新的建模集对训练结束后的第一模型进行测试,直至测试结果符合预设条件。

进一步地,获取用电数据库中的历史用电数据包括:通过多个用电数据平台获取多个用电数据表;去除多个用电数据表中的用户隐私信息;将多个用电数据表进行拼接,其中,如果判断出多个用电数据表中存在重复的属性参数、用电行为参数或缴费行为参数,则将重复的属性参数、用电行为参数或缴费行为参数进行合并。

根据本发明实施例的另一方面,还提供了一种数据处理装置,该装置包括:获取单元,用于获取用电数据库中的历史用电数据,其中,历史用电数据包括用电用户的属性参数以及用电行为参数或缴费行为参数;分类单元,用于将用电数据库中的用电用户按照所处行业进行分类,得到多个类别的用电用户;建模单元,用于根据历史用电数据分别对每个类别的用电用户进行建模,得到欠费风险模型,其中,欠费风险模型用于表示每个类别的用电用户的属性参数、用电行为参数以及缴费行为参数与欠费风险参数之间的关系。

进一步地,获取单元包括:第一确定模块,用于在用电用户的属性参数中确定用户标识参数;抽取模块,用于基于用户标识参数在用电数据库中随机抽取数据,得到建模集和评分集,建模单元包括:建模模块,用于采用多种模型根据建模集分别对每个类别的用电用户进行建模;评分模块,用于通过评分集对每个类别的用电用户的多个欠费风险模型进行评分;第二确定模块,用于确定评分最高的欠费风险模型为对应类别的欠费风险模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网北京市电力公司;国家电网公司,未经国网北京市电力公司;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710504109.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top