[发明专利]一种语音端点检测方法及装置有效
申请号: | 201310656959.6 | 申请日: | 2013-12-06 |
公开(公告)号: | CN104700830B | 公开(公告)日: | 2018-07-24 |
发明(设计)人: | 郭勐;杨蕾;张俭 | 申请(专利权)人: | 中国移动通信集团公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L25/87 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 端点 检测 方法 装置 | ||
1.一种语音端点检测方法,其特征在于,包括:
在确定出有语音输入时,确定当前的网络传输速率;
根据确定出的网络传输速率,确定用于表征语音输入的时长的语音延时;
根据确定出的语音延时,得到语音输入的终止点;
其中,按照下述公式确定当前的网络传输速率:
其中,V是当前的网络传输速率,Pc是语音输入过程中,语音编码队列的当前占用率,TVA是语音输入的时长,Rc是语音输入过程中,输入的语音的编码速率。
2.如权利要求1所述的方法,其特征在于,按照下述公式确定用于表征语音输入的时长的语音延时:
d=SD*V*α
其中,d是语音延时,V是当前的网络传输速率,SD是设定的常量,α是网络传输速率的权重。
3.如权利要求1所述的方法,其特征在于,在确定出当前的网络传输速率之后,确定用于表征语音输入的时长的语音延时之前,还包括:
确定语音输入过程中,在确定出有和语音输入的识别错误率反馈信息时,确定所述识别错误率;以及
在确定出没有和语音输入的识别错误率反馈信息时,确定场景因子,所述场景因子用于表征语音输入过程所在的场景。
4.如权利要求3所述的方法,其特征在于,按照下述公式确定用于表征语音输入的时长的语音延时:
d=SD*V*α+SD*Fs*β
其中,d是语音延时,V是当前的网络传输速率,SD是设定的常量,α是网络传输速率的权重,Fs是识别错误率或场景因子,若Fs是识别错误率时,根据网络传输速率估计的延时确定,β是错误识别率权重,若Fs是场景因子时,FS=EVb/EVa,EVb是语音输入过程中,背景音的功率,EVa是语音输入过程中,输入的语音的功率,β是场景因子权重。
5.一种语音端点检测装置,其特征在于,包括:
语音确定模块,用于确定是否有语音输入;
网络传输速率确定模块,用于在确定出有语音输入时,确定当前的网络传输速率;
语音延时确定模块,用于根据确定出的网络传输速率,确定用于表征语音输入的时长的语音延时;
端点确定模块,用于根据确定出的语音延时,得到语音输入的终止点;
其中,所述网络传输速率确定模块按照下述公式确定当前的网络传输速率:
其中,V是当前的网络传输速率,Pc是语音输入过程中,语音编码队列的当前占用率,TVA是语音输入的时长,Rc是语音输入过程中,输入的语音的编码速率。
6.如权利要求5所述的装置,其特征在于,所述语音延时确定模块,具体用于按照下述公式确定用于表征语音输入的时长的语音延时:
d=SD*V*α
其中,d是语音延时,V是当前的网络传输速率,SD是设定的常量,α是网络传输速率的权重。
7.如权利要求5所述的装置,其特征在于,还包括:
识别错误率确定模块,用于确定语音输入过程中,在确定出有和语音输入的识别错误率反馈信息时,确定所述识别错误率;以及在确定出没有和语音输入的识别错误率反馈信息时,确定场景因子,所述场景因子用于表征语音输入过程所在的场景。
8.如权利要求7所述的装置,其特征在于,所述语音延时确定模块,具体用于按照下述公式确定用于表征语音输入的时长的语音延时:
d=SD*V*α+SD*Fs*β
其中,d是语音延时,V是当前的网络传输速率,SD是设定的常量,α是网络传输速率的权重,Fs是识别错误率或场景因子,若Fs是识别错误率时,根据网络传输速率估计的延时确定,β是错误识别率权重,若Fs是场景因子时,FS=EVb/EVa,EVb是语音输入过程中,背景音的功率,EVa是语音输入过程中,输入的语音的功率,β是场景因子权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团公司,未经中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310656959.6/1.html,转载请声明来源钻瓜专利网。