[发明专利]到站提醒方法、装置、终端及存储介质有效
申请号: | 201911257235.8 | 申请日: | 2019-12-10 |
公开(公告)号: | CN111009261B | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 刘文龙 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/03;G08B21/24 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 邢少真 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 到站 提醒 方法 装置 终端 存储 介质 | ||
1.一种到站提醒方法,其特征在于,所述方法包括:
当处于交通工具时,通过麦克风采集环境音;
对所述环境音对应的音频数据进行分帧加窗处理,得到至少一个音频帧,所述音频帧中包含n个连续的音频窗口,n为大于等于2的整数;
对各个所述音频帧进行时频域特征提取,得到各个音频帧对应的所述时频域特征矩阵,所述时频域特征矩阵用于表示所述环境音对应的音频数据的时域特征和频域特征;
将所述时频域特征矩阵输入声音识别模型,得到所述声音识别模型输出的目标警铃声识别结果,所述目标警铃声识别结果用于指示所述环境音中是否包含目标警铃声,所述目标警铃声为开门警铃声或关门警铃声,所述目标警铃声预先通过处于所述交通工具的终端采集得到;
当预定时长内包含所述目标警铃声的音频帧的个数达到个数阈值时,确定所述环境音中包含所述目标警铃声;
当识别出所述环境音中包含所述目标警铃声时,更新已行驶站数;
当所述已行驶站数达到目标站数时,进行到站提醒,所述目标站数为起始站点与目标站点之间的站数,所述目标站点是中转站点或目的地站点。
2.根据权利要求1所述的方法,其特征在于,所述对所述音频帧进行时频域特征提取,得到各个音频帧对应的所述时频域特征矩阵,包括:
根据各个所述音频窗口的短时能量特征,生成所述音频帧对应的时域特征矩阵,所述时域特征矩阵的第一矩阵维度等于所述音频帧中所述音频窗口的数量;
对所述音频帧进行梅尔频率倒谱系数MFCC特征提取,生成频域特征矩阵,所述频域特征矩阵的所述第一矩阵维度与所述音频窗口的数量相同;
将所述时域特征矩阵和所述频域特征矩阵融合,得到所述时频域特征矩阵。
3.根据权利要求2所述的方法,其特征在于,所述MFCC特征提取包括傅里叶变换过程,所述对所述音频帧进行MFCC特征提取,生成频域特征矩阵,包括:
根据至少两种傅里叶变换精度对所述音频帧进行MFCC特征提取,生成至少两个所述频域特征矩阵,其中,不同频域特征矩阵的所述第一矩阵维度相同,且不同频域特征矩阵的第二矩阵维度不同。
4.根据权利要求1至3任一所述的方法,其特征在于,所述更新已行驶站数,包括:
获取上一警铃识别时刻,所述上一警铃识别时刻为上一次识别出所述环境音中包含所述目标警铃声的时刻;
若所述上一警铃识别时刻与当前警铃识别时刻之间的时间间隔大于时间间隔阈值,则更新所述已行驶站数。
5.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:
通过所述麦克风采集样本音频数据;
当接收到对所述样本音频数据的标记操作时,根据所述标记操作生成训练样本,所述训练样本包括正样本和负样本,且所述训练样本包含样本标签,所述正样本是包含所述目标警铃声的音频数据,所述负样本是不包含所述目标警铃声的音频数据;
将所述训练样本输入所述声音识别模型,得到所述声音识别模型输出的样本识别结果,所述声音识别模型是采用卷积神经网络CNN的二分类模型;
根据所述样本识别结果和所述样本标签,通过焦点损失FocalLoss和梯度下降法训练所述声音识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911257235.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防护服
- 下一篇:一种连续绝热高温硝化甲苯制备单硝基甲苯的方法