[发明专利]一种语音端点检测方法及装置有效
申请号: | 201310656959.6 | 申请日: | 2013-12-06 |
公开(公告)号: | CN104700830B | 公开(公告)日: | 2018-07-24 |
发明(设计)人: | 郭勐;杨蕾;张俭 | 申请(专利权)人: | 中国移动通信集团公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L25/87 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 端点 检测 方法 装置 | ||
本发明公开了一种语音端点检测方法及装置,该方法包括:在确定出有语音输入时,确定当前的网络传输速率;根据确定出的网络传输速率,确定用于表征语音输入的时长的语音延时;根据确定出的语音延时,得到语音输入的终止点。能够较好地解决在网络传输带宽不够的情况下,信号传输延时比较长,使得语音端点识别准确率较低的问题。
技术领域
本发明涉及移动多媒体技术领域,尤其是涉及一种语音端点检测方法及装置。
背景技术
随着人机信息交互技术的发展,语音识别技术显示出其重要性,语音识别需要确定语音端点。语音端点包括语音录入的起始点,以及语音录入的终止点。从语音录入的起始点开始计时,延时一段时长后得到语音录入的终止点。语音端点检测是语音识别是否正确的关键技术之一,可以在语音识别中提高识别精度及减少识别时间。
通常情况下,语音端点检测的具体流程如下述:
步骤一:接收用户输入的触发语音输入的触发指令。
用户可以通过点击语音输入按钮,触发启动终端中的语音输入程序,开启语音录入模式。
步骤二:接收用户录入的语音。
步骤三:终端进入语音录入状态,接收用户录入的语音的起始点。
步骤四:在检测到语音录入的起始点时,开始计时。
步骤五:计时结束后,得到语音录入的终止点。
步骤六:根据得到的语音起始点和语音终止点,完成语音端点检测。
但是,上述语音端点检测过程,语音录入时需要通过网络传输,因此在网络传输带宽不够的情况下,信号传输延时比较长,使得语音端点识别准确率较低。
发明内容
本发明提供了一种语音端点检测方法及装置,能够较好地解决在网络传输带宽不够的情况下,信号传输延时比较长,使得语音端点识别准确率较低的问题。
一种语音端点检测方法,包括:在确定出有语音输入时,确定当前的网络传输速率;根据确定出的网络传输速率,确定用于表征语音输入的时长的语音延时;根据确定出的语音延时,得到语音输入的终止点。
在语音端点确定的过程中,引入网络传输速率,最终根据当前的网络传输速率来确定语音延时,在高带宽的情况下,可以延长语音延时,在网路拥塞的情况下,可以缩短语音延时,从而增加语音识别等应用的成功率,从而增加语音端点检测的准确性。
按照下述公式确定当前的网络传输速率:
其中,V是当前的网络传输速率,Pc是语音输入过程中,语音编码队列的当前占用率,TVA是语音输入的时长,Rc是语音输入过程中,输入的语音的编码速率。
在确定网络传输速率时,综合考虑语音编码队列的当前占用率,以及语音输入的时长,以及语音的编码速率,能够较好地提高确定出当前网络传输速率的准确性。
按照下述公式确定用于表征语音输入的时长的语音延时:
d=SD*V*α
其中,d是语音延时,V是当前的网络传输速率,SD是设定的常量,α是网络传输速率的权重。
最终根据当前的网络传输速率来确定语音延时在高带宽的情况下,可以延长语音延时,在网路拥塞的情况下,可以缩短语音延时,从而增加语音识别等应用的成功率,从而增加语音端点检测的准确性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团公司,未经中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310656959.6/2.html,转载请声明来源钻瓜专利网。