[发明专利]车联网数据处理方法及装置在审
申请号: | 201810571121.X | 申请日: | 2018-06-05 |
公开(公告)号: | CN110633314A | 公开(公告)日: | 2019-12-31 |
发明(设计)人: | 黄忠睿;马智;尹春风;浦晨晨 | 申请(专利权)人: | 上海博泰悦臻网络技术服务有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/28 |
代理公司: | 31264 上海波拓知识产权代理有限公司 | 代理人: | 王春丽 |
地址: | 201821 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 车联网 标准数据 预测模型 目标数据库 数据特征 训练集合 数据处理 数据源 测试 集合 数据处理技术 数据处理效率 接收输入 加载 抽样 转换 汽车 分析 | ||
1.一种车联网数据处理方法,其特征在于,所述车联网数据处理方法,包括:
接收输入的车联网数据,并将接收的车联网数据作为数据源;
对所述数据源进行ETL处理,以转换为标准数据后加载到目标数据库中;
对所述目标数据库中的标准数据进行分析得到数据特征,对所述标准数据进行抽样划分为训练集合和测试集合,根据所述数据特征在所述训练集合上建立多个初步预测模型,并利用所述测试集合对所述多个初步预测模型进行测试得到最终预测模型。
2.根据权利要求1所述的车联网数据处理方法,其特征在于,对所述数据源进行ETL处理,以转换为标准数据后加载到目标数据库中,包括:
从所述数据源抽取所需数据;
从所需数据中过滤掉不符合要求的数据,以得到过滤后的数据;
将所述过滤后的数据转换为标准数据;
按照预先定义好的目标数据库模型,将所述标准数据加载到目标数据库中。
3.根据权利要求1所述的车联网数据处理方法,其特征在于,所述不符合要求的数据包括不完整的数据、错误的数据、重复的数据,所述车联网数据包括车辆故障数据、车辆油耗数据、车辆运行状态数据、车辆监控数据中的至少一种数据类型。
4.根据权利要求1所述的车联网数据处理方法,其特征在于,对所述标准数据进行抽样划分为训练集合和测试集合,包括:
利用随机抽样方法对所述标准数据进行抽样划分为多个训练集合和多个测试集合。
5.根据权利要求1所述的车联网数据处理方法,其特征在于,利用所述测试集合对所述多个初步预测模型进行测试得到最终预测模型,包括:
将每一个初步预测模型在多个测试集合上进行测试,若一个初步预测模型在多个测试集合的测试结果均小于预设误差阈值,则通过测试并将测试结果小于预设误差阈值的初步预测模型作为最终预测模型,若每一个初步预测模型在测试集合的评分均大于预设误差阈值,则重新选择相应的算法或调整参数值,以重新建立多个初步预测模型,并将重新建立的多个初步预测模型在测试集合上进行测试。
6.根据权利要求1所述的车联网数据处理方法,其特征在于,还包括:将新数据输入最终预测模型,对新数据进行预测,以得到预测结果。
7.一种车联网数据处理装置,其特征在于,其包括:输入单元、ETL单元、模型训练单元,其中,
所述输入单元,与所述ETL单元相连,用于接收输入的车联网数据,并将接收的车联网数据作为数据源;
所述ETL单元,与所述模型训练单元相连,用于对所述数据源进行ETL处理,以转换为标准数据后加载到目标数据库中;
所述模型训练单元,用于对所述目标数据库中的标准数据进行分析得到数据特征,对所述标准数据进行抽样划分为训练集合和测试集合,根据所述数据特征在所述训练集合上建立多个初步预测模型,并利用所述测试集合对所述多个初步预测模型进行测试得到最终预测模型。
8.根据权利要求7所述的车联网数据处理装置,其特征在于,所述ETL单元包括数据提取模块、数据清洗模块、数据转换模块以及数据加载模块,其中,
所述数据提取模块,用于从所述数据源抽取所需数据;
所述数据清洗模块,用于从所需数据中过滤掉不符合要求的数据,以得到过滤后的数据;
所述数据转换模块,用于将所述过滤后的数据转换为标准数据;
所述数据加载模块,用于按照预先定义好的目标数据库模型,将所述标准数据加载到目标数据库中。
9.根据权利要求7所述的车联网数据处理装置,其特征在于,所述不符合要求的数据包括不完整的数据、错误的数据、重复的数据,所述车联网数据包括车辆故障数据、车辆油耗数据、车辆运行状态数据、车辆监控数据中的至少一种数据类型。
10.根据权利要求7所述的车联网数据处理装置,其特征在于,所述模型训练单元,还用于将每一个初步预测模型在多个测试集合上进行测试,若一个初步预测模型在多个测试集合的测试结果均小于预设误差阈值,则通过测试并将测试结果小于预设误差阈值的初步预测模型作为最终预测模型,若每一个初步预测模型在测试集合的评分均大于预设误差阈值,则重新选择相应的算法或调整参数值,以重新建立多个初步预测模型,并将重新建立的多个初步预测模型在测试;所述车联网数据处理装置还包括数据预测单元,所述数据预测单元用于将新数据输入最终预测模型,对新数据进行预测,以得到预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海博泰悦臻网络技术服务有限公司,未经上海博泰悦臻网络技术服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810571121.X/1.html,转载请声明来源钻瓜专利网。