[发明专利]一种面向外国留学生的演讲评测方法、装置及系统在审
申请号: | 202110389484.3 | 申请日: | 2021-04-12 |
公开(公告)号: | CN113205729A | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 李会法;沈莺英;谈遥新;张恒彰;王华珍 | 申请(专利权)人: | 华侨大学 |
主分类号: | G09B19/06 | 分类号: | G09B19/06;G06Q10/06;G06F40/211;G06F40/216;G06F40/284;G10L15/26;G10L25/51;G10L25/87 |
代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 张松亭;李艾华 |
地址: | 362000 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 外国 留学生 演讲 评测 方法 装置 系统 | ||
1.一种面向外国留学生的演讲评测方法,其特征在于,包括:
获取演讲者的演讲语音数据;
对所述演讲语音数据进行语音识别,得到识别文本数据;
分别对所述演讲语音数据和所述识别文本数据进行特征提取,得到可量化的评测特征,所述可量化的评测特征包括语音评分特征和语篇评分特征;所述语音评分特征包括流畅度特征、有效性特征、语速特征和语音基础分特征;所述语篇评分特征包括主谓宾句法分析特征、混合句型特征、词汇使用是否得当特征、语言框架得分特征、情感是否健康特征、主题是否相符特征、口语表达思考力特征和语篇基础分特征;
根据所述可量化的评测特征,对所述演讲语音数据进行评价,得到演讲的评测结果。
2.根据权利要求1所述的面向外国留学生的演讲评测方法,其特征在于,提取流畅度特征的方法,包括:
统计所述演讲语音数据中停顿出现的次数TD;停顿指的是对所述演讲语音数据采用VAD算法进行端点检测,获取到语音的端点位置,求相连两个端点之间的时长,超过设置的阈值ht说明出现停顿;
基于停顿出现的次数TD设计输出语音流畅度S;其中,语音流畅度S的取值与所述停顿次数呈反比,即停顿次数越少,语音流畅度S的取值越大;
提取有效性特征的方法,包括:
统计所述识别文本数据中停顿词的数量以及无效重复语音文本的出现次数;具体的,通过基于停顿词表统计文本中停顿的词数量I,基于规则的方法统计文本中的无效重复语音文本的出现次数J;
将停顿词的数量和无效重复语音文本的出现次数作为有效性特征。
3.根据权利要求1所述的面向外国留学生的演讲评测方法,其特征在于,提取语速特征的方法,包括:
获取所述识别文本数据的文本长度L及所述演讲语音数据的音频长度T,计算出语速L/T;
将语速L/T作为语速特征;
提取语音基础分特征的方法,包括:
获取所述演讲语音数据的音频长度T,获取所述音频长度T与预设阈值hvt的比值;所述预设阈值hvt为能使演讲者获得语音基础分满分的演讲音频长度;
将所述音频长度T与预设阈值hvt的比值作为语音基础分特征。
4.根据权利要求1所述的面向外国留学生的演讲评测方法,其特征在于,提取主谓宾句法分析特征的方法,包括:
统计所述识别文本数据的N句文本中,符合语法结构信息标准的句子数量G,得到文本句子结构标准率G/N;
将文本句子结构标准率G/N作为主谓宾句法分析特征;
提取混合句型特征的方法,包括:
统计所述识别文本数据的N句文本中,符合标准句型的句子数量M,得到文本句型标准率M/N;
将文本句型标准率M/N作为主谓宾句法分析特征。
5.根据权利要求1所述的面向外国留学生的演讲评测方法,其特征在于,提取词汇使用是否得当特征的方法,包括:
统计所述识别文本数据的N句文本中,文本出错数量W;
将文本出错数量W作为词汇使用是否得当特征;
提取语言框架得分特征的方法,包括:
将所述识别文本数据以句子为单位进行拆分为一个数组,同时以词为单位进行分词,将分词后的数组与语言框架词典进行匹配,计算符合语言框架句子数量F;
将符合语言框架句子数量F作为语言框架得分特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学,未经华侨大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110389484.3/1.html,转载请声明来源钻瓜专利网。