[发明专利]基于环境背景声感知与分析的室内区域级定位方法有效

申请号：	201910633671.4	申请日：	2019-07-15
公开（公告）号：	CN110333484B	公开（公告）日：	2021-04-13
发明（设计）人：	宋浠瑜;王玫;仇洪冰;罗丽燕;闵梓易	申请（专利权）人：	桂林电子科技大学
主分类号：	G01S5/18	分类号：	G01S5/18;G10L17/04;G10L17/18
代理公司：	桂林市华杰专利商标事务所有限责任公司 45112	代理人：	陆梦云
地址：	541004 广西***	国省代码：	广西;45
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于环境背景感知分析室内区域定位方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于环境背景声感知与分析的室内区域级定位方法，其特征是：包括如下步骤：

(1)通过智能手机麦克风感知室内各区域的环境背景声，并进行预处理；

(2)基于环境声的听觉感知与自动识别理论及方法，提取声信号的低阶声学指纹特征；

(3)通过K均值聚类算法，结合房间几何轮廓信息先验，构建室内空间码本集，并获取声信号的高阶声学指纹；所述构建室内空间码本集是：对于任一室内环境，将其划分为M个子区域，在离线采集环境背景声阶段，每个子区域采集N段音频样本，对每一子区域进行簇指纹的计算，从而形成该室内空间码本集，在线下采集环境背景声阶段，采集人员无需人为地对每段采集音频进行区域号标注，通过对音频样本进行物理空间与分簇空间的匹配，可以实现音频样本区域号的自动化标注，即:区域号＝分簇号；

对任一段时长为t_samp秒的环境音频信号进行计算，则可以得到低阶声学指纹特征帧数为n，那么对于一个室内空间的M×N段音频样本而言，可以得到M×N×n帧数据向量，对这M×N×n帧数据向量进行K-means聚类，分簇数量设为M，则可得到室内空间码本集B_rnum＝[F₁,F₂,…,F_M-1,F_M]，其中F_i,i＝1,...,M表示各簇心向量，下标rnum为房间号；

(4)将高阶声学指纹作为径向基函数核逆向传播神经网络的输入，经过线下训练、线上测试验证，输出用户位置信息。

2.根据权利要求1所述的室内区域级定位方法，其特征是：步骤(1)所述室内各区域环境背景声的预处理的方法是：

利用智能手机麦克风录制室内环境背景声音频，若音频采样频率为f_s，每段音频时长均为t_samp秒，对音频进行分帧，每帧的样点长度为t_spec，帧间重叠率为则每段音频的样点长度为f_st_samp，帧数为然后通过加窗函数，使时域信号能更好地满足离散傅里叶变换处理的周期性要求，减少频谱泄漏。

3.根据权利要求1所述的室内区域级定位方法，其特征是：步骤(2)所述低阶声学指纹特征的提取方法是：

基于环境声的听觉感知与自动识别理论和方法，以心理声学特征的谱域表示作为室内环境背景声音频信号的低阶声学指纹，采用对音色变化鲁棒的chromagram表征环境声的音调属性，反映声能的变化，同时采用sonogram表征环境声的响度属性，反映环境声的强度变化及其频率分布，用spectrogram表征环境声的时频特性；因此，对于每段时长为t_samp秒的环境音频信号而言，其低阶声学指纹的结构为F_first＝[chromagram；sonogram；spectrogram]，对该结构进行如步骤一所述预处理，可以得到帧数据向量，形成低阶声学指纹特征

其中v_r表示F_first的第r帧数据向量；由于低阶声学指纹结构F_first既反映了环境背景声音频信号的时频域特性，又从心理声学角度反映了人类听觉系统对声音主要的主观听觉感知特性，因此，该结构的选取能够提高定位系统的准确率。

4.根据权利要求1所述的室内区域级定位方法，其特征是：步骤(3)所述高阶声学指纹特征的提取方法是：

对任一段时长为t_samp秒的环境音频信号而言，由于其帧数n通常较大，以帧为研究对象，分析该段环境音频信号所对应位置信息的概率密度分布，高阶声学指纹特征的计算过程如下所示：

①利用室内空间码本集B_rnum，寻找与每帧数据向量v_r最接近的簇心向量F_i，并返回分簇号b_r：

②计算低阶声学指纹特征对应的码本向量

③基于码本向量的统计特性，计算高阶声学指纹特征

其中，δ(b_r,i)是克罗内克函数，即：

5.根据权利要求1所述的室内区域级定位方法，其特征是：步骤(4)所述将高阶声学指纹作为径向基函数核逆向传播神经网络的输入，经过线下训练、线上测试验证，输出用户位置信息的方法是通过RBF-BP神经网络识别用户位置，其过程分为两个阶段：

第一阶段是信号的前向传播，从输入层经过隐含层，到达输出层；

第二阶段是误差的反向传播，从输出层经过隐含层，到达输入层，依次调节隐含层到输出层的权重和偏置，输入层到隐含层的权重和偏置；

以RBF作为隐藏层激活函数的BP模型，模拟室内环境用户位置感知系统，RBF为径向基函数，其表达式为：

其中，是作为输入样本的高阶声学指纹，是作为中心样本的高阶声学指纹样本均值，σ_i是RBF作用范围的宽度参数；