[发明专利]一种交互式英语口语校正方法在审
申请号: | 201910517755.1 | 申请日: | 2019-06-14 |
公开(公告)号: | CN110276073A | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 啜春红;卞志勇 | 申请(专利权)人: | 南京机电职业技术学院 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G10L15/06 |
代理公司: | 江苏致邦律师事务所 32230 | 代理人: | 葛胜非;徐蓓 |
地址: | 210015 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预处理 口语交流 时域分割 输入语句 语法结构 校正 口语 使用者发音 训练数据库 发音问题 教学成本 结果获得 训练学习 用户交互 有效信号 语法训练 语言环境 语言识别 语音信号 英语 实时性 同步的 语句 单词 发音 矫正 噪声 提示 抽象 分析 | ||
1.一种交互式英语口语校正方法,其特征在于,包括:
第一步,接收语音信号e(t),其中,所述语音信号e(t)的采样频率不低于6kHz;
第二步,对所述语音信号e(t)进行预处理,滤除其中的噪音信号,并将所述语音信号e(t)的幅值调整至预设范围内,获得有效信号E(t);
第三步,对所述有效信号E(t)按照时间顺序进行时域分割,获得N组信号帧ET1(t),ET2(t),...,ETN(t),N≥2,其中,每组信号帧之间包括有至少1/2的部分相互重叠;
第四步,对每一组信号帧ETn(t),n∈[1,N],分别进行语言识别,计算每一组信号帧ETn(t)相对语言识别所基于的训练数据库中对应单词的误差量ERTn(t),并根据训练数据库中最接近所述信号帧的单词输出每一组信号帧所对应的语言识别结果wTn(t),按照时间顺序拼接各组信号帧所对应的语言识别结果wTn(t)中对应一致的部分,获得输入语句s(m),其中m∈[1,M],M为所述输入语句中的单词总数,m为所述输入语句中的单词序号;
第五步,对所述输入语句s(m)进行特征识别,标记出其中的名词、代词、形容词、副词、动词、数词、冠词、介词、连词,标记出其顺序,将识别标记出的特征的顺序排列为抽象语序组合S(m);
第六步,对所述抽象语序组合S(m)进行拆分并对拆分后的各部分分别进行语法训练;
第七步,输出语法训练结果,与所述抽象语序组合S(m)最接近的语法模型,以及误差量ERTn(t)超出预设值的对应单词。
2.如权利要求1所述的交互式英语口语校正方法,其特征在于,所述第二步中,对所述语音信号e(t)进行的预处理包括:滑动窗口滤波、频域均衡、自动增益调整以及预加重网络计算;
其中,滑动窗口滤波的步骤包括:
首先,确定滑动窗口所对应的时长至少达到16ms,
而后,按照时间顺序以该滑动窗口遍历所述语音信号e(t),遍历过程中分别计算滑动窗口两端语音信号的差值,若该差值大于预设差值范围,则选取所述滑动窗口内的语音信号中差值最小的至少2个数据替换其中差值超出预设差值范围的数据,输出替换后的语音信号作为滑动窗口滤波结果;
其中,遍历过程中,所述滑动窗口的步长不超过所述滑动窗口所对应的时长的1/2。
3.如权利要求1所述的交互式英语口语校正方法,其特征在于,所述第三步中,时域分割具体按照如下步骤进行:
步骤301,计算所述有效信号E(t)的时域包络,对其时域包络的幅值求平均数;
步骤302,查找所述有效信号E(t)中幅值低于所述平均数,且持续时间超出预设时间间隔的停顿点;
步骤303,以所述停顿点对所述有效信号E(t)进行分割,并将分割获得的N组信号帧ET1(t),ET2(t),...,ETN(t),N≥2,扩充为至少与其前一组信号帧之间相互重叠至少1/2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京机电职业技术学院,未经南京机电职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910517755.1/1.html,转载请声明来源钻瓜专利网。