[发明专利]一种考虑地理和线路从属关系的用户特征标签设定方法在审
申请号: | 201810174386.6 | 申请日: | 2018-03-02 |
公开(公告)号: | CN108399553A | 公开(公告)日: | 2018-08-14 |
发明(设计)人: | 周红林;胡扬波;潘留兴;郝翠萍 | 申请(专利权)人: | 江苏电力信息技术有限公司;国网江苏省电力公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q50/06 |
代理公司: | 南京汇盛专利商标事务所(普通合伙) 32238 | 代理人: | 陈扬 |
地址: | 210024 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户特征 特征标签 标签设定 从属关系 关键字对比 标签分类 标签属性 典型特征 动态标签 动态聚类 后续分析 静态标签 数据清洗 用户标签 用户提供 增值服务 标签库 数据集 地理 归约 算法 标签 电网 认可 更新 转化 | ||
1.一种考虑地理和线路从属关系的用户特征标签设定方法,其特征在于具体步骤如下:
(1)对电网内外部获取的客户基本信息、用电量、缴费途径、缴费时间、规定缴费时间范围、所属台区线路、地理信息及供电区域划分范围数据进行处理,利用数据清洗、归约和转化,建立可供后续分析的数据集;
(2)确定典型的用户特征标签为用户年龄、地理特征、所属线路、信誉状况、用电偏好和缴费偏好,根据影响这些用户特征标签属性值的数据的更新频次,将特征标签分为静态标签及动态标签;
(3)结合供电区域的划分信息,并根据用户所处的地理信息和线路配变从属关系,计算用户的地理特征标签;
(4)对样本数据进行正则表达式判断,筛选出符合条件的文本字段,并进行赋值;
(5)利用动态聚类算法,为不同的特征标签确定属性值范围,从而建立典型的用户特征标签库;
(6)最后通过用户数据的关键字段匹配,设定各用户的特征标签。
2.根据权利要求1所述的考虑地理和线路从属关系的用户特征标签设定方法,其特征在于:所述步骤(1)中,电网公司通过数据采集、传输技术,存储了大量的客户基本信息、用电量、缴费途径、缴费时间、客户所属台区线路及地理信息数据,这些数据包括结构化数据和文本类型的半结构化数据,并不能直接用于后续的特征标签分析;利用数据清洗、归约和转化技术对不同来源不同结构的多样化数据进行操作,生成可供特征标签属性值分析的数据样本集;由于导出的客户基本信息及缴费信息中包含着对特征标签设定无意义的字段,故先进行归约,提取出关键字段,并转化为新数据段;而用户用电量、各时段用电分布结构化数据则采用归一化处理,如下式所示:
其中,ai为结构化数据的初始值,Amax,Amin分别为该结构化类型的数据的最大值及最小值。
3.根据权利要求1所述的考虑地理和线路从属关系的用户特征标签设定方法,其特征在于:所述步骤(2)中,不同用户的特征属性存在着交叉,为了更统一地为用户设定标签,选用典型的用户特征标签:用户年龄、地理特征、所属线路、信誉状况、用电偏好和缴费偏好进行分析;根据影响这些典型的用户特征标签属性值的数据的更新频次,将特征标签分为静态标签及动态标签;其中用户年龄、地理特征、所属线路高度关联用户属性为静态标签,较长时间更新一次;而用户信誉状况、用电偏好和缴费偏好为动态标签,受实时数据的影响,更新频率高。
4.根据权利要求1所述的考虑地理和线路从属关系的用户特征标签设定方法,其特征在于:所述步骤(3)中,结合供电区域的划分信息,将供电区域等价为一个多边形,并按下式计算其中心(Xc,Yc):
其中,(xi,yi)为供电区域多边形的顶点坐标表示,A为供电区域等价多边形的面积,当供电区域含有曲线段时,将其细分为小线段进行处理;
同时考虑线路及配变的从属关系,当所属线路配变的地理坐标为(Xt,Yt),用户的地理坐标为(xuse,yuse),按下式计算用户的地理特征标签(X,Y):
5.根据权利要求1所述的考虑地理和线路从属关系的用户特征标签设定方法,其特征在于:所述步骤(4)中,对样本数据中的字段进行正则表达式判断,筛选出符合所写的正则表达式的文本字段,并为其赋值,从而方便文本字段在后续特征标签分析中的应用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏电力信息技术有限公司;国网江苏省电力公司,未经江苏电力信息技术有限公司;国网江苏省电力公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810174386.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于智能快递柜的自助广告方法及装置
- 下一篇:权益卡管理方法、系统及存储介质