[发明专利]基于启发式动态规划的汽车主动降噪方法有效
申请号: | 201710965719.2 | 申请日: | 2017-10-17 |
公开(公告)号: | CN107791970B | 公开(公告)日: | 2019-06-04 |
发明(设计)人: | 李慧;韩金历;张硕;骆万博;顾明;丁逢;马浩博;孙文杰 | 申请(专利权)人: | 长春工业大学 |
主分类号: | B60R16/023 | 分类号: | B60R16/023;G10K11/178;G05B13/04 |
代理公司: | 长春众邦菁华知识产权代理有限公司 22214 | 代理人: | 田春梅 |
地址: | 130021 吉林*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于启发式动态规划的汽车主动降噪方法属于汽车室内噪声的主动降噪方法领域,该方法首创性地在云服务器的虚拟环境中对噪声信息的海量大数据库中的数据进行拟合,通过启发式动态规划训练出的模型网络和执行网络来寻找数据库中噪声频谱特性的规律,将频谱特性相似的噪声数据拟合到一起,建立从庞大的数据库中缩减生成数据量较少的离线专家库,实现噪声数据的最优化,为系统提供最优的控制量,该创新方式使得本方法得以克服现有的汽车主动降噪方法需要对海量数据逐一实时运算的弊端,经过实际测试,该方法完全可以满足真实路况下实际行驶的汽车降噪需求,因此具有较大的市场前景和潜在的经济价值。 | ||
搜索关键词: | 主动降噪 动态规划 启发式 汽车 噪声数据 拟合 数据库 噪声频谱特性 生成数据量 创新方式 大数据库 海量数据 模型网络 频谱特性 实时运算 室内噪声 系统提供 虚拟环境 云服务器 噪声信息 控制量 潜在的 专家库 最优化 降噪 离线 路况 测试 行驶 网络 | ||
【主权项】:
1.基于启发式动态规划的汽车主动降噪方法,其特征在于:该方法包括如下步骤:步骤一:利用给定车型的试验车采集各种行驶工况下的海量噪声数据,其具体包括如下子步骤:步骤1.1:根据被测试的汽车车型,确定该给定车型的试验车,再根据试验车的车室内空间尺寸结构建立三维坐标系,将车室内的空间按坐标划分为一百万个三维空间立方体网格;步骤1.2:在试验车的车室内的前后左右布置四个麦克风拾音器,其中四个麦克风拾音器中的三个共面,另外一个位于该平面以外的其它高度,从而形成四面体布局结构;并在试验车的两侧前车门、后排座椅以及车顶,分别布置四个扬声器喇叭,四个扬声器喇叭也同样形成四面体布局结构;步骤1.3:令试验车进行长途行驶试验,遍历沥青、水泥、砂石、泥土、冰雪、泥浆等道路条件,以及晴天、大风、阴雨、风雪等各类天气条件,并在对应的每一类行驶条件下,由麦克风拾音器采集该试验车匀速行驶、换挡、加速行驶、减速制动等行驶状态,从而通过步骤1.2所述的四个麦克风拾音器广泛收录和存储该试验车在各种行驶工况下的车室内的噪声信息;步骤1.4:将步骤1.2所述的四个麦克风拾音器和四个扬声器喇叭各自的空间位置坐标均输入到步骤1.1所述车室内的三维坐标系下,并将步骤1.3所采集和存储的试验车在各种行驶工况下的噪声信息均上传至云服务器进行存储;步骤二:依据试验车在不同行驶工况下的车室内噪声信息的频谱特性,对任意时刻下的行驶状态和行驶条件共同对应匹配的噪声的频谱特性进行分类,从而建立以声波的频率、幅值、相位三个参量共同作为频谱特性的考察对象,并以某一时刻下的行驶状态和行驶条件特征共同作为表征频谱特性的分类形式;步骤三:建立基于多带通滤波器的降噪参数云网调试系统,其具体包括:建立基于云服务器的数据存储和运算能力的虚拟降噪声源信号发生系统,该降噪声源信号发生系统包括云服务器、由云服务器仿真并虚拟的四个虚拟拾音器、一个虚拟输入端功率放大器、五个虚拟耦合电容、五个虚拟可变带通滤波器、五个虚拟压控位移电路、五个虚拟可变增益放大器、一个虚拟输出端功率放大器和四个虚拟喇叭;每一个虚拟耦合电容均与一个对应的虚拟可变带通滤波器、一个虚拟压控位移电路和一个虚拟可变增益放大器四者共同构成一个给定频段下的虚拟人造降噪消音信号匹配发生通道,所形成的共计五条虚拟人造降噪消音信号匹配发生通道为五条不同频段的声波分析和匹配通道;每一个虚拟拾音器均与虚拟输入端功率放大器的输入端连接,虚拟输入端功率放大器的输出端通过云服务器分别与一条虚拟人造降噪消音信号匹配发生通道中的虚拟耦合电容连接,从而在云服务器中形成共计五条音频信号的虚拟输入通道;每一条虚拟人造降噪消音信号匹配发生通道均通过其虚拟可变增益放大器的输出端与虚拟输出端功率放大器的输入端连接,四个虚拟喇叭的输入端均与虚拟输出端功率放大器的输出端连接;四个虚拟喇叭的输出端均与虚拟输入端功率放大器的输入端连接,从而形成闭环反馈通道;步骤四:建立基于噪声频谱特性和距离矢量之和的噪声矢量表征量:步骤4.1:将步骤一所述一百万个三维空间立方体网格对应的车室内三维坐标系在云服务器中建立虚拟的三维模型,其中每一个网格的中心点均视为一个考察坐标点;步骤4.2:对于每一个步骤4.1所述的考察坐标点,均求得其相对于步骤一所述四个麦克风拾音器的相对位置关系,从而获得该考察坐标点网格中心分别相对于每一个步骤一所述扬声器喇叭的位置向量,以及该考察坐标点相对于四个扬声器喇叭的向量之和;步骤4.4:根据步骤4.2所述每一个考察坐标点的和向量的长度值和声波在给定温湿度的空气中的固有衰减特性,从而分别获得每一个考察坐标点对应的声波衰减特征数据,即获得与当前考察坐标点对应的一个以距离、方向、振幅、频率、相位五者共同为表征的、并且能够反应噪声频谱特性的噪声矢量信号;步骤五:初步完成对噪声数据的时间排序和分类前的数学表达:选择任意一个步骤4.1所述的考察坐标点,将与该考察坐标点所对应的由步骤1.3所采样的全部噪声源信号历史数据按时间排序,并将这些噪声源信号均以步骤4.4所述的能够反应噪声频谱特性的噪声矢量信号的形式在云服务器中进行数学表达,该数学表达是由反应频谱特性的振幅、频率、相位、表示行车运动状态的参量、表示路面状态的参量、以及当前频谱特性对应的分类类别参量,共计六个参量的集合;其中,表示行车运动状态的参量、表示路面状态的参量、以及当前频谱特性对应的分类类别参量,其三者也均可以同时用幅值、频率、相位三个参量共同表示,因此,将幅值、频率、相位三个参量共同作为后续算法所考察的控制向量u(k)和系统的状态向量x(k);按照同样的方法,逐一对每一个考察坐标点均建立基于同一个时间坐标系起点的历史数据表达排序;步骤六:在云网调试系统中建立基于BP神经网络的HDP启发式动态规划算法控制器,其中,启发式动态规划HDP的执行网络、模型网络、评价网络均采用BP神经网络,建立HDP启发式动态规划算法控制器的模型网络、评价网络、执行网络、定义效用函数;其具体包括如下子步骤:步骤6.1:建立HDP启发式动态规划算法控制器的模型网络:所述模型网络的层级结构为6—12—3的层级结构,即输入层包含6个节点、隐藏层包含12个节点、输出层包含3个节点,模型网络采用具有n+m个输入神经元,km个隐层神经元和n个输出神经元的结构;n+m个输入神经元分别为系统k时刻的状态向量x(k)的n个分量以及执行网络对状态向量x(k)的预测控制向量u(k)的m个分量,n个输出则是对系统在k+1时刻的状态向量x(k+1)的预测向量
的n个分量;模型网络的隐藏层采用双极性sigmoidal函数,输出层采用线性函数purelin;其中,系统k时刻下针对任意一个考察坐标点的控制向量u(k)和系统的状态向量x(k)均由步骤五确立;步骤6.2:建立HDP启发式动态规划算法控制器的评价网络:评价网络采用具有n个输入神经元,kj个隐藏层神经元和一个输出神经元的结构;n个输入神经元是状态向量的n个分量;输出神经元则是与输入状态对应的最优性能指标的估计;定义学习效率lc、扣因子γ的值;评价网络的结构为3—3—1,输入层到隐藏层的权值为wc1,隐藏层到输出层的权值为wc2,评价网络允许误差εc,设定学习次数nc,已学习次数c,c的初始值为0;评价网络的隐藏层采用双极性sigmoidal函数,输出层采用线性purelin函数;步骤6.3:建立HDP启发式动态规划算法控制器的执行网络:执行网络采用具有n个输入神经元,ku个隐含层神经元和m个输出神经元的结构;n个输入是系统在k时刻的状态向量x(k)的n个分量;m个输出则是与输入状态x(k)对应的控制向量u(k)的m个分量,初始化执行网络权值;定义执行网络学习效率la及折扣因子γa的值;执行网络的结构为3—12—3,输入层到隐含层的权值为wa1,隐含层到输出层的权值为wa2;其中,系统k时刻下针对任意一个考察坐标点的控制向量u(k)和系统的状态向量x(k)均由步骤五确立;执行网络的隐含层采用双极性sigmoidal函数,输出层采用线性purelin函数;步骤6.4:对步骤6.1所述的模型网络进行初次训练,其具体包括如下子步骤:步骤6.4.1:初步设定一个具体的特定考察坐标点:以身高为170cm的司机在驾驶座椅上端坐时的双耳连线中心作为特定考察坐标点A1,并将由步骤五获得的、与考察A1点对应的控制向量u(k)和系统的状态向量x(k)均作为输入量,并随机初始化模型网络的权值wm1,wm2;其中,wm1为输入层到隐含层的权值,wm2为隐含层到输出层之间的权值,设置训练次数c,允许误差ε,学习效率lm;步骤6.4.2:以步骤6.4.1所述考察A1点作为样本训练模型网络,其对应的控制向量u(k)和系统的状态向量x(k)均作为输入量,输入向量构成矩阵M(k)=[u(k)x(k)]T,输出向量为x(k+1);其中,系统k时刻下针对任意一个考察坐标点的控制向量u(k)和系统的状态向量x(k)均由步骤五获得;其具体包括如下步骤:步骤6.4.3:模型网络的正向计算;![]()
![]()
步骤6.4.4:计算误差的具体数值:
式(4)中,
x(k+1)是模型网络k+1时刻的期望输出值,
是模型网络的预测输出值;步骤6.4.5判断步骤6.4.4所求的误差值Em(k+1)是否小于ε,若误差大于ε且训练次数小于c,则执行步骤6.4.6对模型网络的权值按下面的式子进行更新;若误差小于ε或训练次数大于等于c则执行步骤6.4.7;步骤6.4.6更新权值步骤6.4.6.1:更新隐含层到输出层之间的权值wm2
wm2(k+1)=wm2(k)+Δwm2(k) (6)步骤6.4.6.2:更新输入层到隐含层的权值wm1:
wm1(k+1)=wm1(k)+Δwm1(k) (8)完成两个权值的更新后返回并重新执行步骤6.4.3;6.4.7.1:定义效用函数U(k)=U[x(k),u(k),k];效用函数的作用是将控制量和状态量结合到一起;效用函数是为了更加准确的定义系统的最优性能,不同的效用函数将产生不同的控制器;效用函数的作用是将控制量和状态量结合到一起;以便更加准确的定义系统的最优性能,不同的效用函数将产生不同的控制器;对于本系统,效用函数定义为U(k)=xT(k)Ax(k)+uT(k)Bu(k),其中A为3阶单位阵、B为3阶单位阵;6.4.7.2:确定执行网络与评价网络的结构并初始化神经网络;执行网络的结构为3—12—3,输入层到隐含层的权值为wa1,隐含层到输出层的权值为wa2,学习效率为la;评价网络的结构为3—3—1,输入层到隐含层的权值为wc1,隐含层到输出层的权值为wc2,学习效率为lc,允许误差为εc,设定训练次数为nc,已训练次数为c,初始值c=0;6.4.7.3:从已有的实验数据中,选择N组数据作为训练样本,并设定系统的初始状态x(k);6.4.7.4:将x(k)作为执行网络的输入,产生控制动作u(k);得到u(k)的计算过程如下:![]()
![]()
式中,ah1j(k)是执行网络k时刻隐含层的输出值,xi(k)是执行网络k时刻输入状态的向量值,wa1ij(k)是执行网络k时刻输入层到隐含层的权值;ah2j(k)是执行网络k时刻隐含层到输出层的输入值;uj(k)是执行网络k时刻输出层的输出值,wa2ij(k)是k时刻执行网络隐含层到输出层的权值;6.4.7.6:求解效用函数U(k)的值;U(k)=xT(k)Ax(k)+uT(k)Bu(k)6.4.7.7:将x(k)输入到评价网络,得到k时刻的
计算过程如下:![]()
![]()
式中,ch1j(k)是评价网络k时刻隐含层的输出值,wc1ij(k)是评价网络k时刻输入层到隐含层的权值;ch2j(k)是评价网络k时刻隐含层到输出层的输入值,
是评价函数k时刻的预测输出值,wc2j(k)是k时刻隐含层到输出层的权值;6.4.7.8:将当前阶段的状态x(k)与执行网络输出的控制动作u(k)作为驶入向量M(k)输入到模型网络得到k+1时刻状态x(k+1),得到x(k+1)的计算过程如下:![]()
![]()
6.4.7.9:将状态x(k+1)输入到评价网络获得![]()
的计算过程如下:![]()
![]()
式中,ch1j(k+1)是评价网络k+1时刻隐含层的输出值,ch2j(k+1)是评价网络k+1时刻隐含层到输出层的输入值,
是评价函数k+1时刻的预测输出值;6.4.7.10:计算评价网络误差Ec(k),并判断Ec(k)与εc的大小;如果Ec(k)大于εc,则转步骤6.4.7.11,如果Ec(k)<=εc则转步骤6.4.7.12;评价网络误差Ec(k)的计算如下式所示:
其中,
步骤6.4.7.11:更新评价网络的权值;评价网络的训练也采用梯度下降法,权值更新过程如下:wc2的更新:
wc2(k+1)=wc2(k)+Δwc2(k)wc1的更新:
wc1(k+1)=wc1(k)+Δwc1(k)6.4.7.12:计算执行网络的误差Ea;
6.4.7.13:更新执行网络的权值;执行网络的训练以最小化
为目标,训练也采用梯度下降法,权值更新过程如下:6.4.7.14wa2的更新:
式中,
共m个,wm1u=wm1(1:m,:)即wm1的前m行;wa2(k+1)=wa2(k)+Δwa2(k)wa1的更新:
式中
共m个;wa2(k+1)=wa2(k)+Δwa2(k)6.4.7.15:判断训练是否失败,如果Ec(k+1)>εc,返回步骤6.4.7.4,否则转步骤6.4.7.16;步骤6.4.7.16:判断是否达到最大训练次数,如果达即c>nc,转步骤6.4.7.15,否则,令c=c+1,k=k+1;如果c<=na转步骤6.4.7.4,进行下一次训练;步骤6.4.7.17:初步迭代训练结束;步骤6.4.7:完成对利用特定考察坐标点A1对模型网络的训练子步骤,从而在云服务器中求得针对A1点当前噪声矢量信号的所需人造降噪消音信号最优解;步骤6.5:按照与步骤6.4.1完全相同的方法,在身高为160cm~180cm的垂直高度上,分别设定10个司机双耳连线中心作为特定考察坐标点A1至A10,并重复步骤6.4.1至步骤6.4.7的模型网络训练过程,从而分别求得考察坐标点A1至A10分别对应的当前噪声矢量信号的所需人造降噪消音信号最优解;步骤6.6:按照与步骤6.5完全相同的方法,求取试验车副驾驶座椅的垂直高度上分布的第二组共计10个特定考察坐标点B1至B10分别对应的人造降噪消音信号最优解;步骤6.6:按照与步骤6.5完全相同的方法,分别在试验车后排的三个乘客座椅垂直高度上求取对应的第三、四、五组共计三组,每组10个特定考察坐标点各自位置所分别对应的人造降噪消音信号最优解,从而完成对步骤6.1所述模型网络的训练过程;步骤6.7:从步骤4.1所述的其余考察坐标点中另行随机挑选50个考察点,并按照步骤6.4所述的相同方法,将这50个样本分别带入步骤6.6所述完成训练后的模型网络,对其进行验证;验证结果不收敛或未达到规定的迭代次数时,则按步骤6.4.7.4所述方法重新训练;通过选择100组数据作为训练样本,50组数据作为测试样本;输入样本M(k)=[u(k) x(k)]T(k=1,2,...,100),期望输出样本为x(k),其中u(k)的三个分量分别为频率、相位、幅值,x(k)的三个分量分别为相位、幅值、频率;通过上述方式,最终完成对模型网络的全部训练过程;步骤七:将步骤4.1所述的一百万个网格的中心考察坐标点均逐一作为样本,分别带入步骤6.6完成训练后的HDP启发式动态规划算法控制器的模型网络,求解出每一个考察点各自对应的人造降噪消音信号最优解,并将该最优解的集合作为离线专家数据库,加以保存;步骤八:依据步骤三所述虚拟降噪声源信号发生系统,在同款车型的每一辆商品车中均安装一套真实的车载降噪系统的核心硬件,其具体包括如下子步骤:步骤8.1:在真实的商品车上安装触摸屏显示器、车载控制器、四个拾音器、一个输入端功率放大器、五个耦合电容、五个可变带通滤波器、五个压控位移电路、五个可变增益放大器、一个输出端功率放大器和四个喇叭;每一个耦合电容均与一个对应的可变带通滤波器、一个压控位移电路和一个可变增益放大器四者共同构成一个给定频段下的人造降噪消音信号匹配发生通道,所形成的共计五条人造降噪消音信号匹配发生通道为五条不同频段的声波分析和匹配通道;每一个拾音器均与输入端功率放大器的输入端连接,输入端功率放大器的输出端通过车载控制器分别与一条人造降噪消音信号匹配发生通道中的耦合电容连接,从而形成共计五条音频信号的输入通道;每一条人造降噪消音信号匹配发生通道均通过其可变增益放大器的输出端与输出端功率放大器的输入端连接,四个喇叭的输入端均与输出端功率放大器的输出端连接,四个喇叭的输出端均与输入端功率放大器的输入端连接,触摸屏显示器与车载控制器电气连接;所述四个拾音器和四个喇叭各自在商品车内的空间布局位置均与其各自在步骤1.2所述的试验车中的布置位置完全相同;所述车载控制器与四个拾音器、一个输入端功率放大器、五个耦合电容、五个可变带通滤波器、五个压控位移电路、五个可变增益放大器、一个输出端功率放大器和四个喇叭共同构成一个商品车上的车载降噪系统;步骤8.2:将由步骤七所获得的离线专家库固化到步骤8.1所述商品车的车载控制器中,并由该车载控制器对商品车的车载降噪系统进行控制,实现汽车的主动降噪。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长春工业大学,未经长春工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710965719.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种液压锻造装置
- 下一篇:一种稀土开采用碎石搬运装置