[发明专利]一种基于强化学习的卫星信号周跳探测方法有效
申请号: | 202110123896.2 | 申请日: | 2021-01-29 |
公开(公告)号: | CN112946698B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 夏娜;王振举;罗辉;胡迪;于永堂;张继文;徐思;吴成;何梦花 | 申请(专利权)人: | 合肥工业大学智能制造技术研究院;合肥星北航测信息科技有限公司 |
主分类号: | G01S19/29 | 分类号: | G01S19/29;G01S19/37;G01S19/44;G06N3/044;G06N3/084;G06N3/092 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230051 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 卫星 信号 探测 方法 | ||
1.一种基于强化学习的卫星信号周跳探测方法,其特征是按如下步骤进行:
步骤1:对卫星信号载波相位进行高阶差分处理;
步骤1.1:以所设定的采样周期T获得样本数为k+r+1的载波相位值序列,对所述载波相位值序列进行高阶差分处理,共获得k+1个r阶差分值,其中,载波相位的第i个r阶差分值为r为差分阶数;
利用式(1)计算第i个差分序列xi:
式(1)中,c为使第i个差分序列xi在[-1,1]范围内的缩放系数;
步骤2:利用式(2)所示的坐标延迟重构法构建第j个空间向量Xj并作为第j个训练样本:
式(2)中,xi+1为第i+1个差分序列;k表示训练样本集X的样本数;
步骤3:利用式(3)构造预测方差
式(3)中,是第j个输出预测值,是k个输出预测值的均值;
步骤4:利用式(4)构造第j个周跳探测统计量Dj:
式(4)中,是第j个输出预测值;
步骤5:利用式(5)建立强化学习方法的第j个奖励函数Rj:
式(5)中,η表示奖励值,b表示奖励函数的判决量,S表示当前卫星信号的状态,S′表示当前状态的下一状态;→表示状态的变化;
步骤6:构建强化学习方法的网络模型:
步骤6.1:构建由多个卷积层组成的循环神经网络RNN,并用于对所述训练样本集X进行特征提取,得到多维特征向量;
步骤6.2:构建全连接层,用于将所述多维特征向量映射为一维特征向量;
步骤6.3:构建由两个n输出的全连接层组成的Q网络,用于对一维特征向量进行信息抽象映射,得到卫星信号的预测值;
步骤6.4:构建由一个m连接的全连接层组成的动作向量,用于对所述卫星信号的预测值进行处理,并输出一个含有m个元素的动作向量,包括:m1个调整动作与m2个终止动作;m=m1+m2;
步骤7:对强化学习方法的网络模型进行训练:
步骤7.1:随机初始化Q网络的所有参数的集合w,基于集合w初始化所有的状态,将经验池初始化为空集;
步骤7.2:通过循环神经网络RNN和全连接层获取一维特征向量;
步骤7.3:将一维特征向量作为Q网络的输入,由Q网络输出所有动作对应的Q值,并用ε-贪婪法在当前输出的Q值中选择对应的第j个动作Aj,以1-ε为概率贪婪选择当前最大行为价值的动作,以ε为概率随机从m个动作向量中选择一个动作,其中,ε为探索率,并设初始值为q1,且随着训练周期的增加,将ε逐渐降低至q2;
步骤7.4:在当前卫星信号的状态S下执行第j个动作Aj,得到新状态S′对应的特征向量和第j个奖励Rj;
步骤7.5:将五元组{Yj,Aj,Rj,Y′j,is_endj}存入经验池,其中,Yj为第j个训练样本Xj在状态S下通过循环神经网络RNN和全连接层后得到的特征向量,Rj是在状态S下执行动作Aj后得到的奖赏,Y′j为在新状态S′下通过循环神经网络RNN和全连接层后得到的特征向量,is_endj为终止状态;
步骤7.6:从经验池中采样k个样本,并计算当前输出的第j个预测值
式(6)中,maxA′Q(Y′j,A′,w)表示未来的奖励,γ表示折扣因子,A′j是当前动作Aj的下一步动作;1≤j≤k;
步骤7.7:通过神经网络的梯度反向传播方法来更新Q网络的所有参数,并判断S′是终止状态is_endj是否成立,若成立,则迭代结束,输出第j个预测值并作为卫星信号周跳探测的预测值,再求出新的周跳探测统计量D′j,并依据三倍标准差原理,判断新的周跳探测统计量D′j是否大于a,若是,则认为发生了信号周跳,否则,转到步骤7.3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学智能制造技术研究院;合肥星北航测信息科技有限公司,未经合肥工业大学智能制造技术研究院;合肥星北航测信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110123896.2/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G01S 无线电定向;无线电导航;采用无线电波测距或测速;采用无线电波的反射或再辐射的定位或存在检测;采用其他波的类似装置
G01S19-00 卫星无线电信标定位系统;利用这种系统传输的信号确定位置、速度或姿态
G01S19-01 .传输时间戳信息的卫星无线电信标定位系统,例如,GPS [全球定位系统]、GLONASS[全球导航卫星系统]或GALILEO
G01S19-38 .利用卫星无线电信标定位系统传输的信号来确定导航方案
G01S19-39 ..传输带有时间戳信息的卫星无线电信标定位系统,例如GPS [全球定位系统], GLONASS [全球导航卫星系统]或GALILEO
G01S19-40 ...校正位置、速度或姿态
G01S19-42 ...确定位置