[发明专利]在线英语口语评估系统在审
申请号: | 201610912307.8 | 申请日: | 2016-10-20 |
公开(公告)号: | CN106653055A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 李曙光 | 申请(专利权)人: | 北京创新伙伴教育科技有限公司 |
主分类号: | G10L25/30 | 分类号: | G10L25/30;G10L25/48;G09B5/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100044 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 在线 英语口语 评估 系统 | ||
1.在线英语口语评估系统,其特征在于,包括以下模块:
语音预处理模块,用于将待评测的英语口语音频文件随机分割为等长度切片;
卷积神经网络分析模块,对得到的音频切片进行短时傅里叶变换生成对应的二维时频图,再逐个对二维时频图进行高级抽象,得到音频切片的高级抽象特征;
评估与反馈模块,通过机器学习模型逐个对音频切片的高级抽象特征进行分析得到每个音频切片的分数,再对所有得分取平均数即得到最终的英语口语评估分数。
2.根据权利要求1所述的在线英语口语评估系统,其特征在于,随机音频切片的时长为5秒。
3.根据权利要求1所述的在线英语口语评估系统,其特征在于,语音预处理模块包括以下模块,
语音分析模块,用于将待评测的英语口语音频文件随机分割为等长度切片,再对所有的音频切片进行预加重、语音分帧、加窗和端点检测;
语音信号处理模块,针对所有音频切片,依次完成时域分析、频域分析和倒谱域分析;
声学参数分析模块,对音频切片的声学参数进行分析和计算,声学参数包括MEL频率倒谱系数、线性预测倒谱系数和线谱对系数。
4.根据权利要求3所述的在线英语口语评估系统,其特征在于,语音信号处理模块包括以下模块:
时域分析模块,分析和提取音频切片中的时域特征参数;
频域分析模块,通过带通滤波器组法、短时傅里叶变换法、频域基音检测法、时-频表示方法,提取音频切片的频谱、功率谱、倒频谱、频谱包络;
倒谱域分析模块,通过同态处理分析和提取音频切片的倒谱域特征参数,进一步将声门激励信息和声道响应信息有效地分开:声门激励信息用于判断清浊音、求基音周期,声道响应信息用于求共振峰,用于语音的编码、合成、识别。
5.根据权利要求4所述的在线英语口语评估系统,其特征在于,时域特征参数包括短时能量和短时平均幅度、短时平均过零率、短时自相关系数和短时平均幅度差。
6.根据权利要求1所述的在线英语口语评估系统,其特征在于,卷积神经网络分析模块包括以下模块,
输入模块,将音频切片转化成若干相同尺度的二维时频图;
卷积层C1,将输入模块得到的二维时频图通过可训练的滤波器和可加偏置进行卷积,得到了二维时频图的局部特征;
特征映射图S2,对卷积层C1提取到的二维时频图的局部特征进行采样,加权值,加偏置来计算图像区域特定特征最大值,对图像特征进行聚合和映射;
卷积层C3,将特征映射图S2得到的图像特征进行再一次的卷积计算,得到图像的低维局部特征;
特征映射图S4,对卷积层C3提取的图像特征进行采样,加权值, 加偏置来计算图像区域特定特征平均值,完成对图像特征的最终聚合和映射;
输出模块,将每一个音频切片的声学参数和经过特征映射图S4处理后的图像特征组合后,作为音频切片的整体特征进行输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京创新伙伴教育科技有限公司,未经北京创新伙伴教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610912307.8/1.html,转载请声明来源钻瓜专利网。