[发明专利]语音转换基于扩展内核类网格法处理零散数据建模方法及设备有效
申请号: | 201811131244.8 | 申请日: | 2018-09-27 |
公开(公告)号: | CN109256142B | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 徐宁;潘安顺;倪亚南;刘妍妍;刘小峰 | 申请(专利权)人: | 河海大学常州校区 |
主分类号: | G10L19/04 | 分类号: | G10L19/04 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 213022 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 转换 基于 扩展 内核 网格 处理 零散 数据 建模 方法 设备 | ||
1.一种语音转换基于扩展内核类网格法处理零散数据建模方法,其特征在于,
截取训练数据和测试数据,经过高斯回归模型进行训练,高斯过程采取的是可扩展性内核,建立类网格结构,设置固定数量代表点,结合输入的训练数据,通过局部三次插值和反距离权重插值法进行结构性内核逼近,测试数据基于结构性内核逼近输出的逼近内核来做高斯过程回归映射;
具体包括以下步骤:
S01,输入截取源语音音色特征的多维数据A和目标语音特征多维数据B的其中一维数据B1,截取多维数据A和一维数据B1的前三分之二作为训练数据,截取源语音音色特征多维数据A的后三分之一数据作为测试数据;
S02,基于克罗内克算法和托普列兹算法建立包含固定数量代表点的网格化数据,将训练数据作为零散数据输入建立的网格化数据中;
S03,固定代表点为类网格化的点,采用局部三次插值算法和反距离权重插值算法,结合输入的训练数据进行结构内核逼近,得到近似精确的高斯内核协方差函数;
S04,基于近似精确内核协方差函数对测试数据进行高斯过程回归映射;
所述S02具体包括以下步骤:
(a1)输入训练数据,定义精确标准高斯过程协方差内核为K(x,z)=cov(f(x),f(z)),K(x,z)表示标准高斯过程精确协方差内核函数,x与z分别表示两个不同函数变量,cov()表示协方差函数,f(x)表示协方差函数内的变量;
内核RBF的标准高斯过程精确协方差函数KRBF(x,z),长度尺度内核超参数为l,KRBF(x,z)=exp(-0.5||x-z||2/l2),其中||x-z||2表示x-z的二范数;
(a2)对带有高斯噪声的高斯过程进行建模:y(x)|f1(x)~N(y(x);f1(x),σ2)表示高斯分布,N(y(x);f1(x),σ2)为高斯分布函数,y(x)为目标函数,f1(x)为训练数据集,σ2为高斯噪声,预测分布由n*个测试点x*得出:
cov(f*)=K(x*,x*)-K(x*,a)[K(a,a)+σ2I]-1K(a,x*) (3)
其中f*表示高斯过程预测随机变量,x*为测试点,a和b分别表示训练数据和目标语音数据,为高斯过程后预测的随机变量,θ为高斯过程内核超参数,μ为平均向量,I为单位矩阵,K(a,x*)为训练数据为a与变量x*的协方差内核函数,K(x*,a)为变量x*与训练数据a的协方差内核函数,K(a,a)为训练数据a与训练数据a的协方差内核函数;
(a3)通过高斯过程内核超参数θ求最大边际似然:
logP(y|θ)∝-[yT(kθ+σ2I)-1y+log|kθ+σ2I|], (4)
其中,kθ为n×n的协方差矩阵,I为单位矩阵,P(y|θ)为在θ条件下y的概率,y为目标函数;
yT(kθ+σ2I)-1y为自动校准模型拟合,log|kθ+σ2I|为复杂性惩罚项,用于优化高斯过程内核超参数θ,防止模型过拟合;使用高斯过程计算的瓶颈在于计算克列斯基的分解;
(a4)取代表点,用类网格法将训练数据作精确内核逼近,得到近似内核,用近似内核函数取代标准高斯过程精确协方差内核函数K(x,z),,显示回归子集和完全独立训练条件方法使用近似内核:
对于n个训练点数量,使用代表点结合类网格法对训练数据训练产生于近似内核函数代表点u=[ui],i=1,......m,m为代表点的u数量;K(x,u)、K(u,u)和K(u,z)分别是1×n,m×m和n×1的协方差矩阵,x、z表示标准高斯过程精确协方差内核函数K的函数变量;表示克罗内克函数;表示变量为x和z的显示回归子集近似内核函数,表示变量为x和z的完全独立训练近似内核函数,n为训练点数量;
(a5)类网格化过程中,在笛卡尔网格上有多维输出x∈x,x2,......xp和跨网格维度内核函数的m×m协方差矩阵k,表达为克罗内克函数表示内积符号,k1到kp表示不同的协方差矩阵;表示K(xi(p),xj(p))从第1项到第p项连乘,p为网格维度,xi(p)和xj(p)表示p维xi和xj变量,xi,xj为K的两个不同变量;
(a6)如果是由静态协方差内核k2(x,x’)=k2(x-x’)生成在有规律空间维度上,则托普列兹矩阵延对角线是恒定的,k2是一个Toeplitz协方差矩阵,即k2i,j=k2i+1,j+1=k2(xi-xj),i,j表示k2里的不同变量下标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学常州校区,未经河海大学常州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811131244.8/1.html,转载请声明来源钻瓜专利网。