[发明专利]数据处理方法和装置在审
申请号: | 201710504109.2 | 申请日: | 2017-06-27 |
公开(公告)号: | CN107368918A | 公开(公告)日: | 2017-11-21 |
发明(设计)人: | 朱洁;孙舟;王伟贤;张禄;潘鸣宇;田贺平;李香龙 | 申请(专利权)人: | 国网北京市电力公司;国家电网公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q50/06 |
代理公司: | 北京康信知识产权代理有限责任公司11240 | 代理人: | 赵囡囡,褚敏 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 | ||
1.一种数据处理方法,其特征在于,包括:
获取用电数据库中的历史用电数据,其中,所述历史用电数据包括用电用户的属性参数以及用电行为参数或缴费行为参数;
将所述用电数据库中的用电用户按照所处行业进行分类,得到多个类别的用电用户;
根据所述历史用电数据分别对每个类别的用电用户进行建模,得到欠费风险模型,其中,所述欠费风险模型用于表示每个类别的用电用户的属性参数、用电行为参数以及缴费行为参数与欠费风险参数之间的关系。
2.根据权利要求1所述的方法,其特征在于,
获取用电数据库中的历史用电数据包括:在所述用电用户的属性参数中确定用户标识参数;基于所述用户标识参数在所述用电数据库中随机抽取数据,得到建模集和评分集,
根据所述历史用电数据分别对每个类别的用电用户进行建模包括:采用多种模型根据所述建模集分别对每个类别的用电用户进行建模;通过评分集对每个类别的用电用户的多个欠费风险模型进行评分;确定评分最高的欠费风险模型为对应类别的欠费风险模型。
3.根据权利要求2所述的方法,其特征在于,所述建模集包括训练集、验证集和测试集,所述多种模型包括第一模型,所述多个类别的用电用户包括第一类别的用电用户,采用多种模型根据所述建模集分别对每个类别的用电用户进行建模包括:
通过所述训练集训练所述第一类别的第一模型,并在训练过程中通过所述验证集纠正所述第一模型的过拟合程度;
通过所述测试集测试训练结束后的第一模型,得到测试结果;
判断测试结果是否符合预设条件;
如果判断结果为否,则再次在所述用电数据库中随机抽取数据,得到新的建模集,并根据新的建模集对训练结束后的第一模型进行测试,直至测试结果符合所述预设条件。
4.根据权利要求1所述的方法,其特征在于,获取用电数据库中的历史用电数据包括:
通过多个用电数据平台获取多个用电数据表;
去除所述多个用电数据表中的用户隐私信息;
将所述多个用电数据表进行拼接,其中,如果判断出所述多个用电数据表中存在重复的属性参数、用电行为参数或缴费行为参数,则将重复的属性参数、用电行为参数或缴费行为参数进行合并。
5.一种数据处理装置,其特征在于,包括:
获取单元,用于获取用电数据库中的历史用电数据,其中,所述历史用电数据包括用电用户的属性参数以及用电行为参数或缴费行为参数;
分类单元,用于将所述用电数据库中的用电用户按照所处行业进行分类,得到多个类别的用电用户;
建模单元,用于根据所述历史用电数据分别对每个类别的用电用户进行建模,得到欠费风险模型,其中,所述欠费风险模型用于表示每个类别的用电用户的属性参数、用电行为参数以及缴费行为参数与欠费风险参数之间的关系。
6.根据权利要求5所述的装置,其特征在于,
所述获取单元包括:第一确定模块,用于在所述用电用户的属性参数中确定用户标识参数;抽取模块,用于基于所述用户标识参数在所述用电数据库中随机抽取数据,得到建模集和评分集,
所述建模单元包括:建模模块,用于采用多种模型根据所述建模集分别对每个类别的用电用户进行建模;评分模块,用于通过评分集对每个类别的用电用户的多个欠费风险模型进行评分;第二确定模块,用于确定评分最高的欠费风险模型为对应类别的欠费风险模型。
7.根据权利要求6所述的装置,其特征在于,所述建模集包括训练集、验证集和测试集,所述多种模型包括第一模型,所述多个类别的用电用户包括第一类别的用电用户,所述建模模块包括:
训练子模块,用于通过所述训练集训练所述第一类别的第一模型,并在训练过程中通过所述验证集纠正所述第一模型的过拟合程度;
测试子模块,用于通过所述测试集测试训练结束后的第一模型,得到测试结果;
判断子模块,用于判断测试结果是否符合预设条件;
执行子模块,用于如果判断结果为否,则再次在所述用电数据库中随机抽取数据,得到新的建模集,并根据新的建模集对训练结束后的第一模型进行测试,直至测试结果符合所述预设条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网北京市电力公司;国家电网公司,未经国网北京市电力公司;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710504109.2/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理