[发明专利]一种语音上传方法及装置在审
申请号: | 201711092928.7 | 申请日: | 2017-11-08 |
公开(公告)号: | CN107863113A | 公开(公告)日: | 2018-03-30 |
发明(设计)人: | 郭建辉 | 申请(专利权)人: | 天脉聚源(北京)传媒科技有限公司 |
主分类号: | G10L25/87 | 分类号: | G10L25/87;G10L15/30;H04L29/08 |
代理公司: | 北京尚伦律师事务所11477 | 代理人: | 张亮 |
地址: | 100007 北京市东城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 上传 方法 装置 | ||
技术领域
本发明涉及语音技术领域,特别涉及一种语音上传方法及装置。
背景技术
目前,在很多场景下都会使用到语音输入,而语音输入后就会将语音上传至第三方语音识别应用或者服务器进行语音识别,但相关技术中在进行语音上传时,无法确保每次上传的语音是一个完整的语句,这不利于后期进行语音识别。
发明内容
本发明提供一种语音上传方法及装置,用以在接收语音的过程中,判断是否接收到语音结束事件,当接收到所述语音结束事件时,才上传当前段的语音,从而确保每次上传的语音是一个完整的语句,从而有利于之后进行语音识别。
本发明提供一种语音上传方法,包括:
接收输入的语音;
在接收语音的过程中,判断是否接收到语音结束事件;
当接收到所述语音结束事件时,上传当前段的语音。
在一个实施例中,所述在接收语音的过程中,判断是否接收到语音结束事件,包括:
在接收语音的过程中,判断当前的静音单位个数是否达到预设静音单位个数;
如果达到,则判定接收到所述语音结束事件;否则,判定没有接收到所述语音结束事件。
在一个实施例中,各静音单位的静音持续时长为预设持续时长。
在一个实施例中,所述在接收语音的过程中,判断是否接收到语音结束事件,包括:
在接收语音的过程中,判断是否接收到语音停止指令;
当接收到所述语音停止指令时,判定接收到所述语音结束事件;否则,判定没有接收到所述语音结束事件。
在一个实施例中,所述在接收语音的过程中,判断是否接收到语音结束事件,包括:
在接收语音的过程中,若所述当前段的语音的结束时间与下一段相邻语音的开始时间之间的时间差达到预设时间差,则判定接收到所述语音结束事件,否则,判定没有接收到所述语音结束事件。
本发明还提供一种语音上传装置,包括:
接收模块,用于接收输入的语音;
判断模块,用于在接收语音的过程中,判断是否接收到语音结束事件;
上传模块,用于当接收到所述语音结束事件时,上传当前段的语音。
在一个实施例中,所述判断模块包括:
第一判断子模块,用于在接收语音的过程中,判断当前的静音单位个数是否达到预设静音单位个数;
第一判定子模块,用于如果达到,则判定接收到所述语音结束事件;否则,判定没有接收到所述语音结束事件。
在一个实施例中,各静音单位的静音持续时长为预设持续时长。
在一个实施例中,所述判断模块包括:
第二判断子模块,用于在接收语音的过程中,判断是否接收到语音停止指令;
第二判定子模块,用于当接收到所述语音停止指令时,判定接收到所述语音结束事件;否则,判定没有接收到所述语音结束事件。
在一个实施例中,所述判断模块包括:
第三判定子模块,用于在接收语音的过程中,若所述当前段的语音的结束时间与下一段相邻语音的开始时间之间的时间差达到预设时间差,则判定接收到所述语音结束事件,否则,判定没有接收到所述语音结束事件。
本公开的实施例提供的技术方案可以包括以下有益效果:
在接收语音的过程中,判断是否接收到语音结束事件,当接收到语音结束事件时,才上传当前段的语音,从而可确保每次上传的语音是一个完整的语句,如此,也有利于之后进行语音识别。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是根据一示例性实施例示出的一种语音上传方法的流程图。
图2是根据一示例性实施例示出的另一种语音上传方法的流程图。
图3是根据一示例性实施例示出的一种语音上传装置的框图。
图4是根据一示例性实施例示出的另一种语音上传装置的框图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天脉聚源(北京)传媒科技有限公司,未经天脉聚源(北京)传媒科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711092928.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音频获取方法及装置
- 下一篇:一种超级磁盘驱动器