[发明专利]一种语音处理方法、装置、存储介质及电子设备有效
申请号: | 201910362700.8 | 申请日: | 2019-04-30 |
公开(公告)号: | CN110111778B | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 舒景辰;梁光;谭星;张岱;王正博 | 申请(专利权)人: | 北京大米科技有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/26;G06F40/284 |
代理公司: | 北京恒博知识产权代理有限公司 11528 | 代理人: | 范胜祥 |
地址: | 100007 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 处理 方法 装置 存储 介质 电子设备 | ||
本申请实施例公开了一种语音处理方法、装置、存储介质及电子设备,其中,方法包括:采集所输入的测评语音集合,对所述测评语音集合中各语音词汇进行识别;当检测到在所述测评语音集合中存在无法识别的目标语音词汇时,采用音译方式获取所述目标语音词汇对应的文本词汇;输出所述文本词汇。因此,采用本申请实施例,通过对无法识别的目标语音词汇对应的文本词汇进行识别,可以提高对语音词汇识别的智能性。
技术领域
本申请涉及计算机技术领域,尤其涉及一种语音处理方法、装置、存储介质及电子设备。
背景技术
作为人际交流的重要媒介,口语在实际生活中占有极其重要的地位。随着社会经济的不断发展和全球化趋势的加剧,人们对语言学习的效率以及语言评估的客观性、公正性和规模化测试提出了越来越高的要求。随着语音识别技术的不断成熟,涉及到信号处理、自然语音理解、人工智能、数据挖掘和机器学习等多个学科的智能语音评测技术也得到了越来越广泛的应用。例如,智能辅助教学系统项目在各中小学的推广,普通话口语考试系统在全国的普及等。目前市面上出现了很多辅助口语评测类的电子产品(如点读机、学习电脑)以及口语评测类应用。目前常见的口语学习场景都是指定朗读文本,然后根据学习者朗读的语音进行发音准确性和流畅度的评估。但是,指定朗读文本,就限定了学习者必须指定一个既定的题目或者内容来进行口语练习。因此,为了让学习者能够更加方便地进行口语学习,自由朗读题型便应运而生。自由朗读题型,即学习者随意选择朗读文本进行口语练习。
由于自由朗读题型没有标准答案,在对学习者自由朗读的语音进行评测时,需要先对该语音进行识别,而学习者自由朗读的文本中可能存在一些不常用词汇,现有的语音评测技术无法对这些不常用词汇进行识别,导致对语音词汇识别的智能性低。
发明内容
本申请实施例提供了一种语音处理方法、装置、存储介质及电子设备,通过对无法识别的目标语音词汇对应的文本词汇进行识别,可以提高对语音词汇识别的智能性。其技术方案如下;
第一方面,本申请实施例提供了一种语音处理方法,所述方法包括:
采集所输入的测评语音集合,对所述测评语音集合中各语音词汇进行识别;
当检测到在所述测评语音集合中存在无法识别的目标语音词汇时,采用音译方式获取所述目标语音词汇对应的文本词汇;
输出所述文本词汇。
第二方面,本申请实施例提供了一种语音处理装置,所述装置包括:
词汇识别模块,用于采集所输入的测评语音集合,对所述测评语音集合中各语音词汇进行识别;
词汇获取模块,用于当检测到在所述测评语音集合中存在无法识别的目标语音词汇时,采用音译方式获取所述目标语音词汇对应的文本词汇;
词汇输出模块,用于输出所述文本词汇。
第三方面,本申请实施例提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
第四方面,本申请实施例提供一种电子设备,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
本申请一些实施例提供的技术方案带来的有益效果至少包括:
在本申请一个或多个实施例中,对采集的测评语音集合中的各语音词汇进行识别,对于无法识别的目标语音词汇,采用音译方式获取其对应的文本词汇并进行输出,从而通过对无法识别的目标语音词汇对应的文本词汇进行识别,可以提高对语音词汇识别的智能性。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大米科技有限公司,未经北京大米科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910362700.8/2.html,转载请声明来源钻瓜专利网。