[发明专利]一种基于英语朗读自动打分进行分拆运算精准矫正的方法有效
申请号: | 201910346958.9 | 申请日: | 2019-04-27 |
公开(公告)号: | CN109979257B | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 邝翠珊 | 申请(专利权)人: | 深圳市数字星河科技有限公司 |
主分类号: | G09B5/04 | 分类号: | G09B5/04;G09B7/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518052 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 英语 朗读 自动 打分 进行 运算 精准 矫正 方法 | ||
1.一种基于英语朗读自动打分进行分拆运算精准矫正学习的方法,其特征包括的步骤和要素有:将语音朗读打分分为测试模式和练习测评模式,测试模式只对朗读语音进行测试打分,而练习测评模式时,朗读英语句子语音打分达标时,直接进入下一条文本内容的朗读;分值不达标情况下,运算分析发音错误的单词,采用循环递推打分分拆识别法,首先将文本分拆成单词组,获得单词的标准语音及其声学特征等作为标准参考模型,基于获得的最高分值的语音段,然后进行向前向后的加减时长修正,获得单词较为理想匹配的语音段;
步骤1、英语文本和汉字文本不同,英语文本text通过空格来分隔单词,因此通过split等函数,使用空格为识别子字符串界限的字符,将英语文本变成由各个单词组成的单词数组a,含有缩写符号'的连续字母组合看成一个单词;
步骤2、通过第三方的语音接口获得指定英语单词的语音;
步骤3、并通过预分析获得语音特征,转换成新的标准参考模型M,同时记录单词语音的时长S,并预先假设单词文本被测试朗读的时长S;
音素在第 i段语音每一帧下的后验概率计算法公式1:
取对数然后累计叠加就可以得到音素在第 i段时间点对应的语音段的对数后验概率打分计算公式2:
其中表示音素所对应的第i 段语音的起始时间、Z代表语音中因素总个数、为给定音素 q下观察矢量的概率分布音素总数,这样包含所有音素段语音的对数后验概率的分数均值为公式3:
其中为第k个音素持续的帧数;通过上述计算分值和系统设定的一个达标标准分值比较大小确定朗读语音分值是否达标;
步骤4、取被测试朗读语音中,起始时间1、结束时间为S这一区间为新的被测朗读语音,和步骤3中的M进行比对运算,通过公式1、公式2、公式3计算分值J;
步骤5、取被测试朗读语音中,依次将起始时间加1、结束时间加1这一区间为新的被测朗读语音组,直至结束时间等于原始被测语音的时长、分别和步骤3中的M进行比对运算,通过公式1、公式2、公式3计算分值;
步骤6、将步骤4和步骤5计算的分值进行比对,获得最大值的数值A,及和最大值相对应的起始时间T1和结束时间T2等参数。
2.根据权利要求1所述一种基于英语朗读自动打分进行分拆运算精准矫正学习的方法,其特征还包含的步骤及要素:基于权利要求1获得的最高分值的语音段,然后进行向前向后的加减时长的修正,获得单词较为理想匹配的语音段,紧接权利要求一的步骤:
步骤7、取被测试朗读语音中,依次将起始时间T1循环减1、结束时间T2这一区间为新的被测朗读语音组,直到递减1的起始时间等于1,循环运算中所得语音段的声学特征和步骤3中的M进行比对运算获得分值,分值和步骤6中的A分值比对,如分值大于A,则将A的值设定为当前分值并将T1设定为当前分值对应的起始时间,分值小于A则跳出起始时间递减1的循环;
步骤8、依次将结束时间T2循环减1、起始时间T1这一区间为新的被测朗读语音组,直到递减1的结束时间等于T1,循环运算中所得语音段的声学特征和步骤3中的M进行比对运算获得分值,分值和步骤7中的A分值比对,如分值大于A,则将A的值设定为当前分值并将T2设定为当前分值对应的结束时间,分值小于A则跳出起始时间递减1的循环;
步骤9、取被测试朗读语音中,依次将起始时间T1循环加1、结束时间T2这一区间为新的被测朗读语音组,直到递增加1的起始时间等于T2,循环运算中所得语音段的声学特征和步骤3中的M进行比对运算获得分值,分值和步骤8中的A分值比对,如分值大于A,则将A的值设定为当前分值并将T1设定为当前分值对应的起始时间,分值小于A则跳出起始时间递减1的循环;
步骤10、依次将结束时间T2循环加1、起始时间T1这一区间为新的被测朗读语音组,直到递加1的结束时间等于原始被测语音整体的时长,循环运算中所得语音段的声学特征和步骤3中的M进行比对运算获得分值,分值和步骤9中的A分值比对,如分值大于A,则将A的值设定为当前分值并将T2设定为当前分值对应的结束时间,分值小于A则跳出起始时间递加1的循环;
步骤11、记录单词和通过上述步骤所得的在被朗读语音上对应的起始、结束时间及分值等数据,重复步骤2—10,获得步骤1分拆的所有单词在被朗读语音上对应的起始时间和结束时间,以及相应的分值,其中i下标为单词在文本句子中的序号;
步骤12、单词分值低于系统设置的错误阀值,即定性为朗读发音不合格,则调出上述步骤中当前单词映射的文本,显示到特定的用户界面,提醒用户该单词发音错误,并设置播发点击功能标识播发链接到步骤2形成的单词语音位置,配置相应的程式让学员点击所述播发标记就可听到标准的单词语音,并对单词进行音素、音节级别的分拆分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市数字星河科技有限公司,未经深圳市数字星河科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910346958.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:英语语音教学系统
- 下一篇:一种教学信息展示发布装置