[发明专利]语言能力评测方法、装置、系统、计算机设备及存储介质有效
申请号: | 201910775324.5 | 申请日: | 2019-08-21 |
公开(公告)号: | CN110503941B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 杨昊鹏 | 申请(专利权)人: | 北京隐虚等贤科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/26;G10L15/30;G06F16/11 |
代理公司: | 北京万思博知识产权代理有限公司 11694 | 代理人: | 刘冀 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语言 能力 评测 方法 装置 系统 计算机 设备 存储 介质 | ||
本发明公开了一种语言能力评测方法、装置、系统、计算机设备及存储介质,其中方法包括:采集用户在练习目标语言的声音数据,得到第一音频文件和第二音频文件,其中,第一音频文件和第二音频文件为完全相同的音频文件;按照声音数据的语音顺序将第一音频文件转换成对应单词顺序的语音文本;结合语音文本对第二音频文件进行单词拆分,并对每个单词分别进行发音检测,得到每个单词的发音准确率;基于每个单词的发音准确率计算声音数据的发音准确率。本发明由于音频文件按顺序转写成文本文件,没有对语音识别结果进行修正,可以还原用户的原始声音数据,从而避免了真实数据存在失真和偏差的问题,完全适用于教育和培训等语言练习的应用场景。
技术领域
本发明涉及教育领域,具体涉及一种语言能力评测方法、装置、系统、计算机设备及存储介质。
背景技术
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。
目前软件中评测语言能力,主要会用到基本的语音识别、语义理解等接口进行调用;通过实时分析,或者整段话的信息采集分析用户的语言能力与沟通能力,最终展示给用户直观的为原始数据(即分析结果而非有效信息或数据)。
语音识别技术,也被称为自动语音识别(Automatic Speech Recognition,简称为ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
例如,美国公开专利US6173259B1中,公开了一种现有语音识别技术方案,通过对语音数据的收集、修正,输出结果,实现将语音转化成文本的形式,通过该技术可实现部分的语音修正功能,即用户转写后的语音需要连贯并且符合逻辑;然而,在一些实际的应用场景中,例如教育和培训领域,需要对用户的真实表现做到精准地分析,而现有技术中,语音转写时参考了数据库中大量数据,为了让用户最终转写后的结果是流畅通顺的,该技术做了语音结果修正,在一定程度上,结果并非是用户真实情况数据,与真实数据存在较大的失真与偏差。
发明内容
本发明要解决现有技术中由于语音撰写时参考了数据库大量数据以修正语音结果,导致撰写出的文本数据与真实情况数据存在较大的失真和偏差的问题,从而提供一种语言能力评测方法、装置、系统、计算机设备及存储介质。
本发明的一方面,提供了一种语言能力评测方法,包括:采集用户在练习目标语言的声音数据,得到第一音频文件和第二音频文件,其中,所述第一音频文件和所述第二音频文件为完全相同的音频文件;按照所述声音数据的语音顺序将所述第一音频文件转换成对应单词顺序的语音文本;结合所述语音文本对所述第二音频文件进行单词拆分,并对每个单词分别进行发音检测,得到每个单词的发音准确率;基于每个单词的发音准确率计算所述声音数据的发音准确率。
可选地,对每个单词分别进行发音检测,得到每个单词的发音准确率,包括:逐一标记所述第二音频文件中每个单词所在的音频区间;将每个单词拆分为多个语音片段,每个语音片段对应一个单音节;调用单音节评测接口,对每个单音节进行发音检测,识别出对应单词在当前发音情景下的发音准确率。
可选地,基于每个单词的发音准确率计算所述声音数据的发音准确率,包括:计算所有单词的平均发音准确率和平均音节准确率,其中,所述平均音节准确率为单词中每个音节的准确率的平均值;获取所述平均发音准确率的权重和所述平均音节准确率的权重;对所述平均发音准确率和所述平均音节准确率加权求和,得到所述声音数据的发音准确率。
可选地,在采集用户在练习目标语言的声音数据,得到第一音频文件和第二音频文件之后,还包括:利用所述第二音频文件检测所述用户的语速数据;和/或,利用所述第二音频文件检测所述用户的情绪数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京隐虚等贤科技有限公司,未经北京隐虚等贤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910775324.5/2.html,转载请声明来源钻瓜专利网。