[发明专利]一种基于LSTM预测和平滑分析思想的轨迹数据压缩方法在审
申请号: | 202110271860.9 | 申请日: | 2021-03-12 |
公开(公告)号: | CN112925782A | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 陈雪松;杨智应 | 申请(专利权)人: | 上海海事大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06N3/04;G06N3/08 |
代理公司: | 上海元好知识产权代理有限公司 31323 | 代理人: | 张妍;张静洁 |
地址: | 201306 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 lstm 预测 平滑 分析 思想 轨迹 数据压缩 方法 | ||
1.一种基于LSTM预测和平滑分析思想的轨迹数据压缩方法,其特征在于,包含以下步骤:
步骤S1、对采集的原始轨迹数据进行数据清洗;
步骤S2、制作网络模型输入的数据集格式,将数据清洗后的数据归一化,划分数据集后制作多维多步网络输入数据集;
步骤S3、处理后的轨迹作为网络输入,输入基于LSTM的预测网络模型得到预测轨迹,保存预测得到的轨迹数据;
步骤S4、恢复轨迹数据格式,多维多步数据格式恢复为最初的数据格式;
步骤S5、预测得到的数据集反归一化;
步骤S6、采用平滑分析的思想确定压缩所选取的误差阈值的范围,在随机产生的邻域半径内计算预测轨迹与数据清洗后的轨迹的距离和方向误差,得到压缩阈值SED误差和角度阈值Angle-Deviation;
步骤S7、根据确定的误差阈值压缩原始轨迹,保留大于误差阈值的原始轨迹点,保留点即为压缩后的轨迹。
2.如权利要求1所述的基于LSTM预测和平滑分析思想的轨迹数据压缩方法,其特征在于,所述步骤S1中对采集的原始轨迹数据进行数据清洗的方法包含:
缺失值的处理:删除某个特征的缺失值大于50%的轨迹,对于小于50%的轨迹使用均值填充;
去除异常点:去除速度大于25米每秒的轨迹点;
去除重复点:去除经纬度和高度重复的轨迹点。
3.如权利要求2所述的基于LSTM预测和平滑分析思想的轨迹数据压缩方法,其特征在于,所述步骤S2中制作网络模型输入的数据集格式的方法包含:
数据归一化:使用min-max标准化,让所有的轨迹数据最终落在[0,1]之间;
分割数据集大小:按照4∶1划分处理后的轨迹数据为训练集train和测试集test;
制作网络输入所需多维多步的数据集格式:数据特征维度使用轨迹数据中的经度longitude、纬度latitude和海拔高度altitude三个维度数据,数据量维度设置为使用前3个时刻的轨迹数据,时间步长维度设置为3,预测后3个时刻步长的轨迹状态,定义轨迹集制作函数的回滚参数look_back为3,预测轨迹步长predict_n为3,依次添加到制作的数据集中,训练集train和测试集test使用数据集制作函数得到训练集train_X、train_Y和测试集test_X、test_Y。
4.如权利要求3所述的基于LSTM预测和平滑分析思想的轨迹数据压缩方法,其特征在于,所述步骤S3中的设计基于LSTM的预测网络模型的方法包含:
预测网络模型包含4层LSTM网络和1层全连接层Dense;
在每一层的LSTM网络设置Dropout层;
误差函数使用均方误差MSE;
优化器为Adam。
5.如权利要求4所述的基于LSTM预测和平滑分析思想的轨迹数据压缩方法,其特征在于,所述步骤S4中恢复轨迹数据格式的方法包含:
预测得到的数据是多维多步的三维数组形式数据,三维数组数据中每一个元素是一个二维数组,读取到的二维数组形式为(3,3);
提取每一个读取到的二维数组的首行元素,所有提取到的首行元素合并为新的二维数组;
最终提取到的二维数组为最初的数据格式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110271860.9/1.html,转载请声明来源钻瓜专利网。