[发明专利]一种数据聚类方法和装置在审
申请号: | 201910893359.9 | 申请日: | 2019-09-20 |
公开(公告)号: | CN112541103A | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 雷超 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06Q30/02;G06Q50/16 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李阳;郭晗 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 方法 装置 | ||
1.一种数据聚类方法,其特征在于,包括:
使用缩放变换模型对房产数据集中房产的原始平米价进行缩放变换,得到变换后平米价;
对二维特征空间中以所述房产数据集中房产的面积和所述变换后平米价为坐标的数据点,通过聚类算法聚类为各簇数据,以得到所述房产数据集的聚类结果。
2.根据权利要求1所述的方法,其特征在于,使用缩放变换模型对房产数据集中房产的原始平米价进行缩放变换的步骤,包括:
对输入的原始数据中各小区的房产数据按照类型特征进行划分,得到所述房产数据集,所述房产数据集包括各小区的各类型特征的房产数据;
从所述房产数据集中选取以下三个数据组:基准数据组、第一数据组、第二数据组,每个数据组是同一小区的类型特征相同的房产数据的集合,且所述第一数据组与所述基准数据组相比,单个房产原始平米价相近但面积更大;所述第二数据组与所述基准数据组相比,单个房产面积相近但原始平米价更高,其中,所述相近指的是数值处于同一范围区间;
根据从所述房产数据集中选取的数据组计算所述缩放变换模型的参数值;
使用所述参数值下的所述缩放变换模型对房产数据集中房产的原始平米价进行缩放变换。
3.根据权利要求1所述的方法,其特征在于,使用缩放变换模型对房产数据集中房产的原始平米价进行缩放变换的步骤,包括:
对输入的原始数据中各小区的房产数据按照类型特征进行划分,得到所述房产数据集,所述房产数据集包括各小区的各类型特征的房产数据;
按照房产的面积和原始平米价对所述房产数据集进行切分,得到多个切分后房产数据集;
从每一切分后房产数据集中选取以下三个数据组:基准数据组、第一数据组、第二数据组,每个数据组是同一小区的类型特征相同的房产数据的集合,且所述第一数据组与所述基准数据组相比,单个房产原始平米价相近但面积更大;所述第二数据组与所述基准数据组相比,单个房产面积相近但原始平米价更高,其中,所述相近指的是数值处于同一范围区间;
根据从各切分后房产数据集中选取的数据组,分别计算所述缩放变换模型的与各切分后房产数据集对应的参数值;
对于每一切分后房产数据集,使用对应的参数值下的所述缩放变换模型对各自的房产的原始平米价进行缩放变换。
4.根据权利要求2或3所述的方法,其特征在于,通过如下方式选取所述基准数据组、第一数据组、第二数据组:
按照选取规则从目标房产数据集中选取以下三个小区:基准小区、第一小区、第二小区,根据其中每个小区的交易量最大的一个类型特征的房产数据的集合,分别得到所述基准数据组、第一数据组、第二数据组,所述目标房产数据集为所述房产数据集、切分后房产数据集中的一者。
5.根据权利要求4所述的方法,其特征在于,按照如下选取规则选取所述三个小区:
从所述目标房产数据集的成交量最大的预设数量的小区中,选取面积和原始平米价最小的一个小区作为所述基准小区,选取房产的原始平米价与所述基准小区相近但房产面积更大的一个小区作为所述第一小区,选取房产的面积与所述基准小区相近但原始平米价更高的一个小区作为所述第二小区,其中,所述相近指的是数值处于同一范围区间。
6.根据权利要求2或3所述的方法,其特征在于,所述缩放变换模型的各参数包括:平米价增大引起的平米价增大幅度的变化率、平米价增大引起的平米价增大幅度偏置量、面积增大引起的平米价增大幅度的变化率、面积增大引起的平米价增大幅度偏置量;其中,
根据从所述房产数据集或从各切分后房产数据集中选取的数据组中,各房产的面积和原始平米价以及房产数量,分别计算以下各项的值:所述基准数据组的原始平米价变化幅度Δ0、第一数据组的原始平米价变化幅度Δarea、第二数据组的原始平米价变化幅度Δpsm,所述基准数据组的房产的平均面积x0和平均原始平米价y0,所述第一数据组的房产的平均面积x1,以及所述第二数据组的房产的平均原始平米价y2;
基于计算出的所述各项的值计算所述各参数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910893359.9/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置