[发明专利]一种测算方法及装置在审
申请号: | 202010583497.X | 申请日: | 2020-06-23 |
公开(公告)号: | CN111737317A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 马二超;李亚莉 | 申请(专利权)人: | 广联达科技股份有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/215;G06F16/35;G06F40/289;G06F16/903 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 程超 |
地址: | 100000 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 测算 方法 装置 | ||
1.一种测算方法,其特征在于,所述方法包括:
获取用户调价行为日志;
根据所述用户调价行为日志的分类结果,对所述用户行为记录进行标准化处理,确定标准化数据集;
从所述标准化数据集中获取非异常数据集,根据重采样算法及置信水平参数,确定预测价格区间。
2.根据权利要求1所述的方法,其特征在于,根据所述用户调价行为日志的分类结果,对所述用户行为记录进行标准化处理,确定标准化数据集,包括:
通过关键字匹配与正则表达式在所述用户调价行为日志中检测品种属性值,获得检测结果;
如果所述检测结果为未匹配,则清洗失败,将所述用户调价行为日志保存到数据库;
如果所述检测结果为匹配,则抽取材料规格的值进行处理。
3.根据权利要求2所述的方法,其特征在于,如果所述检测结果为匹配,则抽取材料规格的值进行处理,包括:
通过所述正则表达式的规则逐条抽取所述用户调价行为日志的特定属性值;
判断所述特定属性值是否要重组或转换,获得判断结果;
如果所述判断结果为需要,则将不规范的单位统一成标准单位,获得标准化数据集,并保存到所述数据库。
4.根据权利要求3所述的方法,其特征在于,根据所述用户调价行为日志的分类结果,对所述用户行为记录进行标准化处理,确定标准化数据集后,还包括:
在所述标准化数据集中提取预设时间段的数据进行过滤,获得新数据集;
若所述新数据集大于或等于50,则对所述新数据集排序,并用四分位法将两端各20%可能有异常值的数据剔除,获得所述非异常数据集。
5.根据权利要求4所述的方法,其特征在于,所述根据重采样算法及置信水平参数,确定预测价格区间,包括:
获取所述非异常数据集;
从所述非异常数据集的n个数据中随机抽n条记录,获得最新数据集;
对所述最新数据集进行排序,用置信水平参数设置四分位上、下位的位置,提取上分位和下分位上的数据,记为区间上、下限的值,并分别放入上、下限数组。
6.根据权利要求5所述的方法,其特征在于,并分别放入上、下限数组后,还包括:
判断所述上、下数组长度是否满足预设长度;
若不满足预设长度,则继续从所述非异常数据集n个数据中随机抽n条记录。
7.根据权利要求6所述的方法,其特征在于,判断所述上、下数组长度是否满足预设长度,还包括:
若满足预设长度,则对所述上、下限数组分别求平均值;
根据所述平均值,获得所述预测价格区间。
8.根据权利要求1所述的方法,其特征在于,所述获取用户调价行为日志前,包括:
获取样本数据;
合并所述样本数据的名称和属性描述信息,其中,所述样本数据包括:建筑材料数据和非建筑材料数据;
进行分词处理,从生成新记录;
将所述新记录进行向量化处理,并通过文本分类算法训练,形成分类模型。
9.一种测算装置,其特征在于,所述装置包括:
获取单元,用于获取用户调价行为日志;
清洗单元,用于根据所述用户调价行为日志的分类结果,对所述用户行为记录进行标准化处理,确定标准化数据集;
测算单元,用于从所述标准化数据集中获取非异常数据集,根据重采样算法及置信水平参数,确定预测价格区间。
10.一种测算装置,其特征在于,所述装置包括:存储器、处理器以及存储在存储器被处理器运行的可响应程序,其特征在于,所述处理器运行所述可响应程序时响应如权利要求1至8任一项所述的测算方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广联达科技股份有限公司,未经广联达科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010583497.X/1.html,转载请声明来源钻瓜专利网。