[发明专利]音频场景的识别、马达驱动方法和系统、电子设备在审
申请号: | 202111173519.6 | 申请日: | 2021-10-08 |
公开(公告)号: | CN113975809A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 缪丽林;李慧 | 申请(专利权)人: | 上海艾为电子技术股份有限公司 |
主分类号: | A63F13/54 | 分类号: | A63F13/54;A63F13/803;G10L25/27;G10L25/51 |
代理公司: | 深圳市嘉勤知识产权代理有限公司 44651 | 代理人: | 董琳 |
地址: | 201100 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 场景 识别 马达 驱动 方法 系统 电子设备 | ||
1.一种音频场景的识别方法,其特征在于,包括:
获取待处理音频数据;
将所述待处理音频数据分割为时序上连续的多帧音频单元;
对各帧音频单元根据音频场景对应的波段特征进行滤波处理,获取目标音频;
获取目标音频中各帧音频单元的帧数计数和能量均值;所述帧数计数用于表征特定场景具有的特征;
将所述帧数计数或能量均值与不同音频场景对应的特征阈值进行比较,判断各帧音频单元对应的音频场景。
2.根据权利要求1所述的音频场景的识别方法,其特征在于,所述目标音频包括第一目标音频和第二目标音频;所述第一目标音频中各帧音频单元的帧数计数为第一帧数计数,能量均值为第一平均值;所述第二目标音频中各帧音频单元的帧数计数为第二帧数计数;所述特征阈值包括第一触发阈值和最小帧数计数值;
所述将所述帧数计数和平均值与不同音频场景对应的特征阈值进行比较,判断各帧音频单元对应的音频场景包括:
根据所述第一目标音频中各帧的第一帧数计数的取值特征设定各帧的第一触发阈值;判定第一平均值大于第一触发阈值的音频单元产生于第一音频场景;所述第一音频场景为操控目标在第一方向速度发生变化的场景;
判定所述第二帧数计数大于或者等于最小帧数计数值的音频单元产生于第二音频场景;所述第二音频场景为所述操控目标在第二方向速度发生变化的场景。
3.根据权利要求2所述的音频场景的识别方法,其特征在于,所述第一触发阈值包括递增的初级触发阈值、中级触发阈值和高级触发阈值;
所述根据所述第一目标音频中各帧的第一帧数计数的取值特征设定各帧的第一触发阈值包括:
若GAIN_CNT(n)a*GAIN_CNT_STEP,则将所述第一触发阈值设为初级触发阈值;其中,GAIN_CNT(n)表示当前帧的第一帧数计数,GAIN_CNT_STEP表示间隔阈值,a为正数,符号*表示相乘;所述间隔阈值用于描述第一触发阈值中各级阈值之间的间隔;
若a*GAIN_CNT_STEP≤GAIN_CNT(n)2a*GAIN_CNT_STEP,则将所述第一触发阈值设为中级触发阈值;
若2a*GAIN_CNT_STEP≤GAIN_CNT(n)3a*GAIN_CNT_STEP,则将所述第一触发阈值设为高级触发阈值。
4.根据权利要求2所述的音频场景的识别方法,其特征在于,在将所述帧数计数或能量均值与不同音频场景对应的特征阈值进行比较,判断各帧音频单元对应的音频场景之前,还包括:
根据前一帧的第一帧数计数、当前帧的第一平均值和间隔阈值确定当前帧的第一帧数计数;其中,前一帧为当前帧之前一帧;
和/或,
根据前一帧的第二帧数计数、当前帧的第二平均值和第二触发阈值确定当前帧的第二帧数计数;其中,所述第二平均值为所述第二目标音频中相应音频单元的能量均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海艾为电子技术股份有限公司,未经上海艾为电子技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111173519.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于二胺检测的AIE柱芳烃荧光探针及其制法与应用
- 下一篇:抗细菌化合物