[发明专利]对用户语音信号进行处理的方法及其系统在审
申请号: | 201410563622.5 | 申请日: | 2014-10-21 |
公开(公告)号: | CN105529038A | 公开(公告)日: | 2016-04-27 |
发明(设计)人: | 李晓辉;许敏强 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L15/16;H04M3/493;H04M3/51 |
代理公司: | 上海一平知识产权代理有限公司 31266 | 代理人: | 须一平;成春荣 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 语音 信号 进行 处理 方法 及其 系统 | ||
1.一种对用户语音信号进行处理的方法,用户可通过输入特定按键表 示语音结束,其特征在于,包括以下步骤:
服务器接收用户语音信号,该用户语音信号混合了该语音终端通过话筒 接收到的外部语音和该语音终端自身的双音多频按键音;
服务器对收到的用户语音信号进行频谱分析,得到用户语音信号的频 谱;
根据所述频谱中预先设定的按键对应的双音多频目标频率分量的大小, 判断在通话过程中预先设定的按键是否被按下;
如果预先设定的按键被按下,则判定用户当前的语音输入已经结束。
2.根据权利要求1所述的对用户语音信号进行处理的方法,其特征在 于,在所述判定用户当前的语音输入已经结束的步骤之后,还包括步骤:
停止语音信号的录制并将录制的语音信号发送给语音识别服务器进行 识别,根据识别结果查询应答内容服务器得到应答结果,将应答结果转换为 语音信号发送给语音终端。
3.根据权利要求1所述的对用户语音信号进行处理的方法,其特征在 于,在所述"根据所述频谱中预先设定的按键对应的双音多频目标频率分量 的大小,判断在通话过程中预先设定的按键是否被按下"的步骤中,包括以 下子步骤:
根据所述用户语音信号的频谱,检测各帧信号中所述预先设定的按键对 应的双音多频目标频率分量的能量占全频带能量的比例是否超过第一阈值, 如果超过,则判定该帧信号为所述按键对应的双音多频信号;
将所述用户语音信号中为所述按键对应的双音多频信号的连续多帧的 帧数与第二阈值进行比较;
如果所述帧数超过所述第二阈值,再检测所述连续多帧的前后帧是否不 是所述按键对应的双音多频信号;
如果所述连续多帧的前后帧不是所述按键对应的双音多频信号,则判定 在通话过程中预先设定的按键被按下。
4.根据权利要求1所述的对用户语音信号进行处理的方法,其特征在 于,在所述“根据所述频谱中预先设定的按键对应的双音多频目标频率分量 的大小,判断在通话过程中预先设定的按键是否被按下”的步骤之后,还包 括步骤:
对所述用户语音信号进行语音活动检测,判断所述用户语音信号中静音 时间是否达到设定的连续静音长度阈值,如果达到该连续静音长度阈值则判 定为用户当前的语音输入已经结束。
5.根据权利要求4所述的对用户语音信号进行处理的方法,其特征在 于,在所述“对所述用户语音信号进行语音活动检测,判断所述用户语音信 号中静音时间是否达到设定的连续静音长度阈值,如果达到该连续静音长度 阈值则判定为用户当前的语音输入已经结束”的步骤中,包括以下子步骤:
对所述用户语音信号进行特征提取;
将所述从用户语音信号中提取的特征输入到训练过的神经网络中,所述 神经网络将所述输入的特征判别为静音和语音的概率;
根据所述静音和语音的概率判决为静音或者语音;
根据所述静音或者语音的判决结果,计算连续静音的长度,如果达到设 定的连续静音长度阈值,则判定为用户当前的语音输入已经结束。
6.根据权利要求5所述的对用户语音信号进行处理的方法,其特征在 于,在所述对用户语音信号进行特征提取的步骤中,所述特征包括PLP特 征和基音信息,所述PLP特征和基音信息的一阶差分和二阶差分形成的42 维的PLP特征。
7.根据权利要求4所述的对用户语音信号进行处理的方法,其特征在 于,在所述“对所述用户语音信号进行语音活动检测,判断所述用户语音信 号中静音时间是否达到设定的连续静音长度阈值,如果达到该连续静音长度 阈值则判定为用户当前的语音输入已经结束”的步骤之前,还包括步骤:
经过一个语音识别系统,获取语音数据和静音数据,并以获取到的语音 数据和静音数据作为训练集合来训练神经网络。
8.根据权利要求7所述的对用户语音信号进行处理的方法,其特征在 于,所述语音识别系统为基于隐马尔科夫模型和深度神经网络的语音识别系 统,所述训练神经网络的步骤包括基于受限玻尔兹曼机的预训练和基于反向 传播算法的训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410563622.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种镀银铝带铠装抗压绝缘电线
- 下一篇:一种用于智能穿戴设备的系统