[发明专利]英语语音分析和加强学习系统及方法在审
申请号: | 202010616079.6 | 申请日: | 2020-06-30 |
公开(公告)号: | CN111798867A | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 樊星 | 申请(专利权)人: | 上海松鼠课堂人工智能科技有限公司 |
主分类号: | G10L25/18 | 分类号: | G10L25/18;G10L25/30;G10L25/51;G09B5/04;G09B19/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200237 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 英语 语音 分析 加强 学习 系统 方法 | ||
1.英语语音分析和加强学习系统,其特征在于,包括语音采集模块、声波频谱获取模块、单词发音准确性评价模块和单词读音训练模块;其中,所述语音采集模块用于采集预设对象诵读英语对应的语音声波信号,并对所述语音声波信号进行单词诵读语音提取处理,以此获得一个或者多个单词诵读语音声波信号,其中,所述语音声波信号包括所述预设对象诵读单词和语句的语音声波信号;
所述声波频谱获取模块用于对每一个所述单词诵读语音声波信号进行音频向量分析,以此获得对应的声波频谱;
所述单词发音准确性评价模块用于通过预设神经网络模型对所述声波频谱进行分析处理,以此评价所述预设对象当前诵读英语过程中单词发音标准性;
所述单词读音训练模块用于根据所述单词发音标准性的评价结果,向所述预设对象推送与单词读音相关联的若干单词,以此进行单词读音训练。
2.如权利要求1所述的英语语音分析和加强学习系统,其特征在于:
所述语音采集模块包括语音声波信号采集与判断子模块、声波信号停顿状态确定子模块和语句诵读声波信号划分子模块;其中,
所述语音声波信号采集与判断子模块用于以16000次/s的采样频率采集所述预设对象英语对应的语音声波信号,并判断所述语音声波信号属于单词诵读语音声波信号还是语句诵读声波信号,以及在所述语音声波信号属于单词诵读语音声波信号时,将当前的语音声波信号直接作为一个单词诵读声波信号;
所述声波信号停顿状态确定子模块用于在所述语音声波信号属于语句诵读声波信号时,计算所述语音声波信号对应的所有语音帧能量分布值,并判断每一帧能量分布值是否超过预设能量阈值,若超过,则确定当前语音帧属于诵读状态,若不超过,则确定当前语音帧属于非诵读的停顿状态;
所述语句诵读声波信号划分子模块用于根据所有所述停顿状态,对所述语音声波信号进行单一单词诵读划分处理,以此将所述语音声波信号划分为多个单词诵读语音声波信号。
3.如权利要求1所述的英语语音分析和加强学习系统,其特征在于:
所述声波频谱获取模块包括音频向量确定子模块和声波频谱计算子模块;其中,
所述音频向量确定子模块用于根据每一个所述单词诵读语音声波信号生成如下的16000个/s的数列
x1,1,x1,2,x1,3,…,x1,16000,x2,1,x2,2,…,x2,16000,…,xt,1,…,xt,16000,……
再按照20ms的间隔对所述数列划分为800个音频块,所述800个音频块记为下面音频向量
yi=(yi1,yi2,…,yi800)T;
所述声波频谱计算子模块用于根据下面公式(1),对所述音频向量进行线性插值,
在上述公式(1)中,Δt=1/16000,k=1,2…800
对上述公式(1)进行傅里叶展开处理,即如下面公式(2)所示
在上述公式(2)中,j表示单位虚数,系数Cn由傅里叶逆变换求得,即
再将所有系数共同组成如下面公式(3)所示的声波频谱X
X=(C1,C2,…,C799,C800)T (3)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海松鼠课堂人工智能科技有限公司,未经上海松鼠课堂人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010616079.6/1.html,转载请声明来源钻瓜专利网。