[发明专利]一种开放性创建语音朗读标准参考模型的方法有效

申请号：	201910304950.6	申请日：	2019-04-16
公开（公告）号：	CN110047466B	公开（公告）日：	2021-04-13
发明（设计）人：	邝翠珊	申请（专利权）人：	深圳市数字星河科技有限公司
主分类号：	G10L15/01	分类号：	G10L15/01;G10L15/06;G10L15/08;G10L15/14
代理公司：	暂无信息	代理人：	暂无信息
地址：	518052 广东省深圳市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种开放性创建语音朗读标准参考模型方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种开放性针对现有文本创建语音朗读标准参考模型的方法，其特征包含的步骤及要素：

S1.配置服务器及数据库，创建语音朗读标准参考模型分类：播音朗读、感情朗读、柔声朗读、颤音朗读……，创建储存语音朗读标准参考模型分类相关的数据库表格；创建被朗读文本内容、文本分类的类别、与文本对应的语音朗读标准参考模型等等相关的表格；

S2.设置用户系统，包含普通用户类、专家类、系统管理类等用户系统，并配置相应的诸如用户注册、用户界面、用户管理等关于用户的程序及存储信息的数据库表格；

S3.预先在系统中内置一定数量的语音朗读标准参考模型，创建各种相关功能：普通用户的用户界面，用户通过录音设备在系统里朗读升级为专家用户的测试内容，通过程序的内置循环，采用不同的语音朗读标准参考模型对目标音素及其语音进行观察，并计算出相应的得分，所述得分分别与预设计算的阀值比对筛选出高匹配性的语音朗读标准参考模型列，并和系统核心语音朗读标准参考模型进行加权归一化综合，获得最终得分，所有得分在一定数值之上，经提交申请，并经过系统审核后，升级成专家用户;

S4.在专家用户界面，创立编辑语音朗读标准参考模型的用户界面，设置任务栏并在内容中排序显示可创建语音朗读标准参考模型任务相关的文本，创建各种相关功模块包含：专家通过录音设备或传感器进行朗读，删除、储存等编辑、确认后提交给系统程序进行自动化先期验证，即和系统内置的评分系统进行打分，系统验证通过后触发系统激活专家用户界面上的提交按钮，专家用户确认并提交所述创建的内容给系统管理用户；

S5.系统后台收到专家用户创建并提交的新语音朗读标准参考模型后，进行质量审查，并将审查状态记载到相应创建语音朗读标准参考模型的记录到数据库，供相应的专家用户查看其用户名下提交记录的审批状态，合格的语音朗读标准参考模型通过审核，开放到普通用户进行语音自动化打分所依赖的语音朗读标准参考模型的模型库中，将其记录的状态设置为可用状态。

2.根据权利要求1所述一种开放性针对现有文本创建语音朗读标准参考模型的方法，其特征还包含的步骤及要素：A、对用于计算语音朗读标准参考模型的语音，把语音转换成二进制数据赋值给VARIANT类型的变量，存放于数据库相对应的表格，方便读取、调用、修改等操作，普通用户进行朗读打分时在其界面上创建配套的调用模块，将分值最高所依赖的语音朗读标准参考模型对应的语音文件从数据库调出，用户点击事件里设置播放所述语音文件的模块；B、对用户用于练习测试的朗读语音，直接储存于服务器特定路径的目录下，并在数据库相对应的表格中记录所述语音相关的信息，诸如用户名，文件路径及名称，日期。

3.根据权利要求1所述一种开放性针对现有文本创建语音朗读标准参考模型的方法，其特征还包含的步骤及要素：普通用户进行朗读标准文本的英语测试时，经过个性化语音朗读标准参考模型的设置，即没有经过个性化所述设置时，系统自动弹出或跳转到语音朗读标准参考模型测试窗口，所述窗口包含数个待被朗读的文本，用户朗读文本提交后，系统对其语音特征分别和系统中内置的语音朗读标准参考模型进行打分，将分值较高所采纳的语音朗读标准参考模型设定到用户默认的测试朗读水平的语音朗读标准参考模型组。

4.根据权利要求1所述一种开放性针对现有文本创建语音朗读标准参考模型的方法，其特征还包含的步骤及要素：系统内没有英语文本对应的语音朗读标准参考模型时候，则使用语音引擎或第三方语音api接口，通过pos提交，形成语音文件，再分析计算特征形成语音朗读标准参考模型。

5.根据权利要求1所述一种开放性针对现有文本创建语音朗读标准参考模型的方法，其特征包含的步骤及要素：基于权利要求1的S5步骤中普通用户进行语音自动化打分，采用一种基于文本内容英语朗读打分多语音朗读标准参考模型比对优化的方法：

步骤1、在系统中设置语音朗读标准参考模型的种类，其中包含系统核心语音朗读标准参考模型, , ,....，由专家用户创立经过系统平台审核通过的语音朗读标准参考模型 , , ,.....等；

步骤2、已知待评分语音的一组观察序列y=( , , ,…) ,语音朗读标准参考模型中多组状态序列s = ( , , ,…),那么模型s产生观察序列y 的概率为 ,解码过程中运用Viterbi算法,将音素对齐后,选择最可能与观察序列y 对应的状态序列S ,由此得到对数后验概率的算法：音素在第 i段语音每一帧下的后验概率取对数然后累计叠加就可以得到音素在第 i段语音下的对数后验概率打分计算公式：

其中表示音素所对应的第i 段语音的起始时间、Z代表语音中音素总个数、为给定音素 q下观察矢量的概率分布音素总数，这样包含所有音素段语音的对数后验概率的分数均值为：

其中为第k个音素持续的帧数；

步骤3、通过步骤2的算法，将待测评的音素及其语音的特征分别和系统核心语音朗读标准参考模型及由专家用户创立经过系统平台审核通过的语音朗读标准参考模型进行打分运算,并通过程序依次算出最终得分，依据加法平均值乘一个系统设定的阀值系数r,筛选出分值大于阀值的有效的模型基准观察的得分数合格的参考模型列： , , ，.......\ , , ，.......；

步骤4、根据上述步骤的运算，对步骤3所得的列依次加权算出最终得分：

其中g、h分别为加权系数，m、n分别为系统核心语音朗读标准参考模型、由专家用户创立经过系统平台审核通过的语音朗读标准参考模型的数量，y为被测目标语音，分别为y音素集合在m、n语音模型下被观察并计算出的得分。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳市数字星河科技有限公司，未经深圳市数字星河科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910304950.6/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种开放性创建语音朗读标准参考模型的方法有效

专利文献下载