[发明专利]一种开放性创建语音朗读标准参考模型的方法有效
申请号: | 201910304950.6 | 申请日: | 2019-04-16 |
公开(公告)号: | CN110047466B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 邝翠珊 | 申请(专利权)人: | 深圳市数字星河科技有限公司 |
主分类号: | G10L15/01 | 分类号: | G10L15/01;G10L15/06;G10L15/08;G10L15/14 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518052 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 开放性 创建 语音 朗读 标准 参考 模型 方法 | ||
本发明是一种开放性创建语音朗读标准参考模型的方法,用户经过程序测试和系统审核成为专家用户,获得开放性创建朗读语音的标准参考模型的权限和操作,从而让特定的英语文本获得多个标准参考模型,用户进行英语朗读时,其语音特征就可以和多个和用户匹配的标准参考模型比对计算分值,通过对分值进行归一优化,减小因用户朗读单个字母、词的语音特性受上下文的影响改变了重音、音调、音量和发音速度等造成的等评分误差。
技术领域
本发明涉及语音识朗读打分技术领域,尤其涉及一种开放性创建英语朗读打分标准参考模型的方法。
背景技术
现今学术界专家一致认为语音技术是近期信息技术领域十大重要的科技发展技术之一,语音识别的应用领域非常广泛,在英语文本朗读打分上也得到了大量研究和应用,研究出采用对数似然度打分 对数后验概率打分、 段分类打分、段时长打分或其改进算法等打分的技术方案。
现有的英语朗读识别及打分系统,具有代表性的是由卡奈基梅隆大学用Ja v a语言开发的一种大词汇量 、连续的语音识别系统s P h i n x 4 ;, 由它的前端(Fron-tEnd) 、 解码器(Deeoder) 、知识库(Li n即i st)三部分共同实现对, sph i n x 4提供的多个语音朗读标准参考模型 ,使得程序打分和现实专家打分差距明显的缩小,显而易见语音朗读标准参考模型对英语朗读打分的重要性,限定被朗读英语文本的内容,尚可保证一定的准确率,有限数量的语音朗读标准参考模型也难以适应较大范围的英语文本、朗读重音、音调、音量和发音速度多样性变化,英语朗读打分往往会语音朗读标准参考模型样本的影响,造成先验概率值分布不均匀,误差较大,因语音朗读标准参考模型的数量和质量在一定程度上限制了英语语音识别打分的精准程度和英语朗读自动打分练习、测试更为广泛的普及。
发明内容
针对以上背景技术的存在的问题,本发明是一种开放性创建语音朗读标准参考模型的方法,用户经过程序测试和系统审核成为专家用户,获得开放性创建朗读语音的标准参考模型的权限和操作,从而让特定的英语文本获得多个语音朗读标准参考模型,用户进行英语朗读时,系统获取的语音特征就可以和多个和用户匹配的语音朗读标准参考模型比对获得分值,通过对所述分值进行归一优化,减小因用户朗读单个字母、词的语音特性受上下文的影响改变了重音、音调、音量和发音速度等造成的等评分误差,从而满足用户英语语音朗读训练、测评的针对性、个性化要求,提高英语朗读的学习效率,具体实施如下:
出于对系统的稳定性、兼容性、用户体验、成本等方面的的综合考虑,本发明采用服务器程序模块和客户端程序模块。
服务器模块从使用角色上来区分包括设置学员用户模块、专家模块、系统管理用户模块。
1、配置服务器及数据库,创建语音朗读标准参考模型分类:播音朗读、感情朗读、柔声朗读、颤音朗读……,创建储存语音朗读标准参考模型分类相关的数据库表格。
2、在数据库上分别创建用于存储被朗读文本内容、文本分类的类别、与文本对应的标准参考模板等等相关的表格。
3、设置用户系统,包含普通用户类、专家类、系统管理类等用户系统,并配置相应的诸如用户注册,用户界面、用户管理等关于用户的程序及存储信息的数据库表格。
4、对语音文件在系统的存储本发明采用两种:A、对用于计算特征创建标准参考模板的语音使用AppendChunk函数,AppendChunk包含在 Field 对象中,原型为:HRESULTAppendChunk (const _variant_t Data );把语音转换成二进制数据赋值给VARIANT类型的变量,存放于数据库相对应的表格,方便读取、调用、修改等操作,普通用户进行朗读打分时,在其界面上创建配套的调用模块,将分值最高所用到的语音朗读标准参考模型对应的语音文件从数据库调出,用户点击事件里设置播放所述语音文件模块;B、对用户用于练习测试的朗读语音,直接储存于服务器特定路径的目录下,并在数据库相对应的表格中记录所述语音相关的信息,诸如用户名,文件路径及名称,日期等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市数字星河科技有限公司,未经深圳市数字星河科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910304950.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种会计语言识别信息录入装置
- 下一篇:语音识别方法、装置及存储介质