[发明专利]基于环境背景声感知与分析的室内区域级定位方法有效
申请号: | 201910633671.4 | 申请日: | 2019-07-15 |
公开(公告)号: | CN110333484B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 宋浠瑜;王玫;仇洪冰;罗丽燕;闵梓易 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G01S5/18 | 分类号: | G01S5/18;G10L17/04;G10L17/18 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 陆梦云 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 环境 背景 感知 分析 室内 区域 定位 方法 | ||
1.一种基于环境背景声感知与分析的室内区域级定位方法,其特征是:包括如下步骤:
(1)通过智能手机麦克风感知室内各区域的环境背景声,并进行预处理;
(2)基于环境声的听觉感知与自动识别理论及方法,提取声信号的低阶声学指纹特征;
(3)通过K均值聚类算法,结合房间几何轮廓信息先验,构建室内空间码本集,并获取声信号的高阶声学指纹;所述构建室内空间码本集是:对于任一室内环境,将其划分为M个子区域,在离线采集环境背景声阶段,每个子区域采集N段音频样本,对每一子区域进行簇指纹的计算,从而形成该室内空间码本集,在线下采集环境背景声阶段,采集人员无需人为地对每段采集音频进行区域号标注,通过对音频样本进行物理空间与分簇空间的匹配,可以实现音频样本区域号的自动化标注,即:区域号=分簇号;
对任一段时长为tsamp秒的环境音频信号进行计算,则可以得到低阶声学指纹特征帧数为n,那么对于一个室内空间的M×N段音频样本而言,可以得到M×N×n帧数据向量,对这M×N×n帧数据向量进行K-means聚类,分簇数量设为M,则可得到室内空间码本集Brnum=[F1,F2,…,FM-1,FM],其中Fi,i=1,...,M表示各簇心向量,下标rnum为房间号;
(4)将高阶声学指纹作为径向基函数核逆向传播神经网络的输入,经过线下训练、线上测试验证,输出用户位置信息。
2.根据权利要求1所述的室内区域级定位方法,其特征是:步骤(1)所述室内各区域环境背景声的预处理的方法是:
利用智能手机麦克风录制室内环境背景声音频,若音频采样频率为fs,每段音频时长均为tsamp秒,对音频进行分帧,每帧的样点长度为tspec,帧间重叠率为则每段音频的样点长度为fstsamp,帧数为然后通过加窗函数,使时域信号能更好地满足离散傅里叶变换处理的周期性要求,减少频谱泄漏。
3.根据权利要求1所述的室内区域级定位方法,其特征是:步骤(2)所述低阶声学指纹特征的提取方法是:
基于环境声的听觉感知与自动识别理论和方法,以心理声学特征的谱域表示作为室内环境背景声音频信号的低阶声学指纹,采用对音色变化鲁棒的chromagram表征环境声的音调属性,反映声能的变化,同时采用sonogram表征环境声的响度属性,反映环境声的强度变化及其频率分布,用spectrogram表征环境声的时频特性; 因此,对于每段时长为tsamp秒的环境音频信号而言,其低阶声学指纹的结构为Ffirst=[chromagram;sonogram;spectrogram],对该结构进行如步骤一所述预处理,可以得到帧数据向量,形成低阶声学指纹特征
其中vr表示Ffirst的第r帧数据向量; 由于低阶声学指纹结构Ffirst既反映了环境背景声音频信号的时频域特性,又从心理声学角度反映了人类听觉系统对声音主要的主观听觉感知特性,因此,该结构的选取能够提高定位系统的准确率。
4.根据权利要求1所述的室内区域级定位方法,其特征是:步骤(3)所述高阶声学指纹特征的提取方法是:
对任一段时长为tsamp秒的环境音频信号而言,由于其帧数n通常较大,以帧为研究对象,分析该段环境音频信号所对应位置信息的概率密度分布,高阶声学指纹特征的计算过程如下所示:
①利用室内空间码本集Brnum,寻找与每帧数据向量vr最接近的簇心向量Fi,并返回分簇号br:
②计算低阶声学指纹特征对应的码本向量
③基于码本向量的统计特性,计算高阶声学指纹特征
其中,δ(br,i)是克罗内克函数,即:
5.根据权利要求1所述的室内区域级定位方法,其特征是:步骤(4)所述将高阶声学指纹作为径向基函数核逆向传播神经网络的输入,经过线下训练、线上测试验证,输出用户位置信息的方法是通过RBF-BP神经网络识别用户位置,其过程分为两个阶段:
第一阶段是信号的前向传播,从输入层经过隐含层,到达输出层;
第二阶段是误差的反向传播,从输出层经过隐含层,到达输入层,依次调节隐含层到输出层的权重和偏置,输入层到隐含层的权重和偏置;
以RBF作为隐藏层激活函数的BP模型,模拟室内环境用户位置感知系统,RBF为径向基函数,其表达式为:
其中,是作为输入样本的高阶声学指纹,是作为中心样本的高阶声学指纹样本均值,σi是RBF作用范围的宽度参数;
当RBF-BP网络第次迭代时,输出的位置信息估计值为Y=[y1,y2],真实值为即j=2,其中y1和分别表示第次输出的房间号估计值与真实值,y2和分别表示第次输出的该房间内子区域号估计值与真实值,那么第次输出的估计值与真实值的均方误差(mean-square error,MSE)可表示为:
以最速下降法为例更新BP网络的输出层与隐藏层之间的权重参数wij:
其中,和分别表示第次和第次网络迭代后输出层与隐藏层之间的权重参数,η为RBF-BP网络学习速度,可分解为:
①
又∵yj=f(nj),f(·)是purelin函数
②其中P为RBF基函数个数
根据上述第①和第②步,可以得到:
其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910633671.4/1.html,转载请声明来源钻瓜专利网。