[发明专利]语音采集自动停止的方法、装置、终端设备和存储介质有效
申请号: | 201911077811.0 | 申请日: | 2019-11-06 |
公开(公告)号: | CN110970054B | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 曹桐军 | 申请(专利权)人: | 广州视源电子科技股份有限公司;广州视睿电子科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/03;G06F3/16 |
代理公司: | 北京泽方誉航专利代理事务所(普通合伙) 11884 | 代理人: | 陈照辉 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 采集 自动 停止 方法 装置 终端设备 存储 介质 | ||
本发明实施例公开了一种语音采集自动停止的方法、装置、终端设备和存储介质。该方法包括:显示文字语料,所述文字语料用于语音测试;接收开始指令,所述开始指令用于触发采集得到用于语音测试的音频数据;提取采集到的音频数据的频率特征;当所述频率特征满足预设的特征模型,或采集到的音频数据达到所述文字语料的对应时长时,停止采集音频数据。被测者或者参与测评的工作人员在测试开始后无需对语音采集过程进行手动控制,简化了基于机器测试的语音测试过程中用户的交互操作,尤其对于被测者自行控制的测试过程中,可以专注于根据文字语料进行语音表达,不用分散精力进行测试过程中的各种中断控制或者结束控制。
技术领域
本发明实施例涉及语音识别技术领域,尤其涉及语音采集自动停止的方法、装置、终端设备和存储介质。
背景技术
随着人们对语言学习的重视逐渐加强,目前,语音测试己经成为大多数语言水平考试的重要组成部分,而语音测试需要大量的口语练习。但是,口语的自测和正式测试都需要他人的参与评判。例如传统的语音测试需要大量的人力资源进行人工评分,这种评分方式有各方面的问题,例如评分员资源短缺、人工评测成本高、评分带有主观性。
随着语言理论、语音识别和人工智能的发展,面对着口语日常练习和语音测试的庞大的需求,越来越多的口语机器测试方案开始出现,但是现有的口语机器测试方案更多着眼于解决语音测试评分的机器实现本身,被测者或者参与测评的工作人员需要全程关注机器测试并进行测试过程的控制,机器测试过程的用户参与需求过多。
发明内容
本发明提供了一种语音采集自动停止的方法、装置、终端设备和存储介质,以解决现有技术机器实现语音测试的过程中,用户参与需求过多的技术问题。
第一方面,本发明实施例提供了语音采集自动停止的方法,包括:
显示文字语料,所述文字语料用于语音测试;
接收开始指令,所述开始指令用于触发采集得到用于语音测试的音频数据;
提取采集到的音频数据的频率特征;
当所述频率特征满足预设的特征模型,或采集到的音频数据达到所述文字语料的对应时长时,停止采集音频数据。
其中,所述提取采集到的音频数据的频率特征,包括:
实时计算所述音频数据的频率数据;
统计所述频率数据中预设低频范围内的持续时长;
统计所述频率数据中的频率波动幅度;
对应的,所述当所述频率特征满足预设的特征模型,或采集到的音频数据达到所述文字语料的对应时长时,停止采集音频数据,具体为:
当所述频率数据中预设低频范围内的持续时长达到预设时长,或频率波动幅度在预设的异常波动幅度范围内,或采集到的音频数据达到所述文字语料的对应时长时,停止采集音频数据。
其中,所述统计所述频率数据中的频率波动幅度,包括:
统计所述频率数据中连续的数据段之间的频率相似度,所述频率相似度用于表征所述数据段之间的频率波动幅度;
所述频率波动幅度在预设的移动波动幅度范围内,具体为:
连续预设个数的数据段的频率相似度达到预设的相似度门限值。
其中,所述方法还包括:
若所述频率特征满足预设的特征模型时停止采集音频数据,则输出语音采集失败提醒。
其中,所述方法还包括:
若采集到的音频数据达到所述文字语料的对应时长时停止采集音频数据,则保存采集到的音频数据,并根据所述文字语料生成语音测试结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司;广州视睿电子科技有限公司,未经广州视源电子科技股份有限公司;广州视睿电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911077811.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种企业办公用品管理方法
- 下一篇:用于桥墩模板的支护装置