[发明专利]一种语音端点检测方法及装置有效

申请号：	201310656959.6	申请日：	2013-12-06
公开（公告）号：	CN104700830B	公开（公告）日：	2018-07-24
发明（设计）人：	郭勐;杨蕾;张俭	申请（专利权）人：	中国移动通信集团公司
主分类号：	G10L15/04	分类号：	G10L15/04;G10L25/87
代理公司：	北京同达信恒知识产权代理有限公司 11291	代理人：	郭润湘
地址：	100032 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音端点检测方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音端点检测方法，其特征在于，包括：

在确定出有语音输入时，确定当前的网络传输速率；

根据确定出的网络传输速率，确定用于表征语音输入的时长的语音延时；

根据确定出的语音延时，得到语音输入的终止点；

其中，按照下述公式确定当前的网络传输速率：

其中，V是当前的网络传输速率，P_c是语音输入过程中，语音编码队列的当前占用率，T_VA是语音输入的时长，R_c是语音输入过程中，输入的语音的编码速率。

2.如权利要求1所述的方法，其特征在于，按照下述公式确定用于表征语音输入的时长的语音延时：

d＝S_D*V*α

其中，d是语音延时，V是当前的网络传输速率，S_D是设定的常量，α是网络传输速率的权重。

3.如权利要求1所述的方法，其特征在于，在确定出当前的网络传输速率之后，确定用于表征语音输入的时长的语音延时之前，还包括：

确定语音输入过程中，在确定出有和语音输入的识别错误率反馈信息时，确定所述识别错误率；以及

在确定出没有和语音输入的识别错误率反馈信息时，确定场景因子，所述场景因子用于表征语音输入过程所在的场景。

4.如权利要求3所述的方法，其特征在于，按照下述公式确定用于表征语音输入的时长的语音延时：

d＝S_D*V*α+S_D*F_s*β

其中，d是语音延时，V是当前的网络传输速率，S_D是设定的常量，α是网络传输速率的权重，F_s是识别错误率或场景因子，若F_s是识别错误率时，根据网络传输速率估计的延时确定，β是错误识别率权重，若F_s是场景因子时，F_S＝E_Vb/E_Va，E_Vb是语音输入过程中，背景音的功率，E_Va是语音输入过程中，输入的语音的功率，β是场景因子权重。

5.一种语音端点检测装置，其特征在于，包括：

语音确定模块，用于确定是否有语音输入；

网络传输速率确定模块，用于在确定出有语音输入时，确定当前的网络传输速率；

语音延时确定模块，用于根据确定出的网络传输速率，确定用于表征语音输入的时长的语音延时；

端点确定模块，用于根据确定出的语音延时，得到语音输入的终止点；

其中，所述网络传输速率确定模块按照下述公式确定当前的网络传输速率：

6.如权利要求5所述的装置，其特征在于，所述语音延时确定模块，具体用于按照下述公式确定用于表征语音输入的时长的语音延时：

d＝S_D*V*α

其中，d是语音延时，V是当前的网络传输速率，S_D是设定的常量，α是网络传输速率的权重。

7.如权利要求5所述的装置，其特征在于，还包括：

识别错误率确定模块，用于确定语音输入过程中，在确定出有和语音输入的识别错误率反馈信息时，确定所述识别错误率；以及在确定出没有和语音输入的识别错误率反馈信息时，确定场景因子，所述场景因子用于表征语音输入过程所在的场景。

8.如权利要求7所述的装置，其特征在于，所述语音延时确定模块，具体用于按照下述公式确定用于表征语音输入的时长的语音延时：