[发明专利]多异构设备下的扬声器音频分类方法在审
申请号: | 202310049668.4 | 申请日: | 2023-02-01 |
公开(公告)号: | CN116092514A | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 蒋洪波;张泰源;刘代波;肖竹;曾凡仔 | 申请(专利权)人: | 湖南大学 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/18;G10L25/27;G10L25/51 |
代理公司: | 长沙轩荣专利代理有限公司 43235 | 代理人: | 董崇东 |
地址: | 410000 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多异构 设备 扬声器 音频 分类 方法 | ||
本公开实施例中提供了一种多异构设备下的扬声器音频分类方法,属于数据识别技术领域,具体包括:步骤1,调用手机内置加速度传感器采集同一板载扬声器播放的初始振动信号;步骤2,对初始振动信号进行预处理操作;步骤3,剔除预处理后的初始振动信号中的干扰信号,得到目标振动信号;步骤4,筛选与音频内容高度相关和设备无关的信号统计特征;步骤5,根据信号统计特征,使用对抗性神经网络对目标振动信号的音频内容进行分类。通过本公开的方案,提高了语音识别的效率和精准度。
技术领域
本公开实施例涉及数据识别技术领域,尤其涉及一种多异构设备下的扬声器音频分类方法。
背景技术
目前,如今,配备各种嵌入式传感器(如扬声器、麦克风和加速度计等)以实现广泛应用的现代智能手机已成为人们日常生活中不可或缺的一部分。在智能手机传感器中,扬声器是用于电话、语音信息和视频播放的重要传感器。扬声器播放的音频信息可能涉及用户的敏感和个人信息,如用户身份、财务信息、密码和偏好规划信息等。由于其重要性,麦克风(即音频记录组件)的系统权限被设置为商用智能手机操作系统(如Android和iOS)中的最高级别,这大大减少了恶意应用程序的语音隐私泄漏。
然而,有经验证据揭示了设备多样性造成的一个关键限制,在该领域的现有工作正在遭受以下问题:到达内置加速度计的扬声器诱导的振动信号(称为LIV)携带与设备物理结构高度相关的大量信息,这一点以前被最近的研究怀疑。因此,这种固有的设备多样性可能会严重阻碍基于LIV的音频内容攻击的通用性,这种攻击涉及大量的异质设备。由于涉及海量的异构设备,新的攻击场景带来了前所未有的设备多样性问题。因此,这将使现有方法失效,因为在某些设备上分析和训练基于LIV的音频信号的努力可能无法应用于携带相同音频信息但由与这些训练设备不完全相同的另一设备收集的LIV信号。
可见,亟需一种高效精准的多异构设备下的扬声器音频分类方法。
发明内容
有鉴于此,本公开实施例提供一种多异构设备下的扬声器音频分类方法,至少部分解决现有技术中存在音频分类的效率和精准度较差的问题。
第一方面,本公开实施例提供了一种多异构设备下的扬声器音频分类方法,包括:
步骤1,调用手机内置加速度传感器采集同一板载扬声器播放的初始振动信号;
步骤2,对初始振动信号进行预处理操作;
步骤3,剔除预处理后的初始振动信号中的干扰信号,得到目标振动信号;
步骤4,筛选与音频内容高度相关和设备无关的信号统计特征;
步骤5,根据信号统计特征,使用对抗性神经网络对目标振动信号的音频内容进行分类。
根据本公开实施例的一种具体实现方式,所述步骤2具体包括:
对初始振动信号进行插值;
使用预设截止频率的卡尔曼滤波器对初始振动信号进行过滤;
使用粗粒度和细粒度分割方式,基于信号时域和频域信号的幅值阈值对初始振动信号进行分割;
利用预设公式将初始振动信号进行归一化。
根据本公开实施例的一种具体实现方式,所述预设公式为其中,μ是原始信号幅值的平均值,max(abs(Signal))是原始信号幅值绝对值的最大值,Signal(i)是原始信号第i个幅值,Signal(i)Normalization是原始信号归一化后的第i个幅值。
根据本公开实施例的一种具体实现方式,所述步骤3具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310049668.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能LED路灯
- 下一篇:一种防止高碳钢30MnB5开浇粘结的方法