[发明专利]语音转换基于扩展内核类网格法处理零散数据建模方法及设备有效
申请号: | 201811131244.8 | 申请日: | 2018-09-27 |
公开(公告)号: | CN109256142B | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 徐宁;潘安顺;倪亚南;刘妍妍;刘小峰 | 申请(专利权)人: | 河海大学常州校区 |
主分类号: | G10L19/04 | 分类号: | G10L19/04 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 213022 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 转换 基于 扩展 内核 网格 处理 零散 数据 建模 方法 设备 | ||
本发明公开了一种语音转换基于可扩展内核类网格法处理零散数据建模方法,语音数据根据时间间隔经过前期的预处理分帧,语音转换通过取源语音某一音色的多维数据与目标语音的对应一维数据进行映射拟合,源语音的多维数据和一维目标语音数据作为训练数据,经过高斯回归模型进行训练,高斯过程采取可扩展性内核,建立类似网格结构,从中设置合适数量代表点通过局部三次插值和反距离权重插值法来作结构性内核逼近,从而大大加快高斯回归模型快速拟合;本发明通过设置合适数量代表点作精确内核逼近得到近似内核,这样既降低高斯过程计算量,大幅减小数据训练时间,又不会降低回归预测精度,做到同时兼顾。
技术领域
本发明涉及语音转换数据处理领域,具体涉及语音转换类网格法和近似内核构建的高斯回归模型建模方法。
背景技术
语音转换依靠现代信息数据处理才可实现,语音的每一帧数据可以用多维特征参数来描述,比如说用共振峰有关参数,就是一帧语音数据的共振峰频率(第一维),带宽(第二维),能量频谱倾斜(第三维)等。在语音转换中可以将源语音的多维特征参数与目标语音的一维特征参数通过标准高斯进行模型训练,然后输入训练数据进行回归及预测。
高斯过程回归可以用于大数据类型建模的灵活的函数逼近器,通过可诠释和可表达的协方差内核使用大数据信息,学习复杂的结构模型。但是它们O(n3)的计算和O(n2)的储存限制了它们,n为训练数据量,当n变大时,计算量成三次方倍增长。这就使高斯过程只满足小数据集,最多包涵几千训练点。而可扩展性高斯内核函数和类网格法解决了这一问题。将高斯过程建模放到更大的数据集中建模训练。
高斯过程回归计算量极大,为了解决这个问题,就会推导协方差内核的现有结构,为了达到更高精度和扩展性,有利于对大数据集的灵活学习。类网格法的使用极大加速了高斯回归映射的计算速度。其中克罗内克(Kronecker)方法需要输入(预测)在多维网格上,这使得它不适用于大多数数据集,虽然也扩展了部分网格结构,但扩展后的网格不适用于训练数据任意定位输入。同样,托普列兹(Toeplitz)法受限制于数据限制在有规律空间的一维网格,最常见的是图像数据。但是一般取少量代表点作近似内核来作标准高斯过程回归,精度的影响非常大,所以代表点的数量也决定着预测回归的精度。
当今已存在的语音转换零散数据建模中,在神经网络回归过程对数据要求严格,对数据预处理,归一化,调参都非常繁琐,甚至回归预测精度都严重不符。而传统标准高斯过程的零散数据做回归拟合,虽然精度很好,但是计算速度过于缓慢,不适用于更大数据集的训练测试。
发明内容
为了解决语音转换过程中高斯回归模型由于计算量不能用于大数据集,训练用时过长问题,本发明公开一种语音转换基于可扩展内核类网格法处理零散数据建模方法,在处理零散状语音数据时,因为一般的网格法用于处理图像数据,图像数据可以直接放入规律网格,而语音数据则需要作预处理,再把零散数据放入类网格中,解除对网格的依赖。然后在输入数据中选取代表点用三次插值和反距离权重插值求出稀疏权重矩阵得到对精确内核的逼近内核,再通过高斯过程做回归预测。这样大幅减小计算量,提高计算速度,并且对预测精度几乎无损。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种语音转换基于可扩展内核类网格法处理零散数据建模方法,截取训练数据和测试数据,经过高斯回归模型进行训练,高斯过程采取的是可扩展性内核,建立类网格结构,设置固定数量代表点,结合输入的训练数据,通过局部三次插值和反距离权重插值法进行结构性内核逼近,测试数据基于结构性内核逼近输出的逼近内核来做高斯过程回归映射。
具体包括以下步骤:
S01,输入截取源语音音色特征的多维数据A和目标语音特征多维数据B的其中一维数据B1,截取多维数据A和一维数据B1的前三分之二作为训练数据,截取源语音音色特征多维数据A的后三分之一数据作为测试数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学常州校区,未经河海大学常州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811131244.8/2.html,转载请声明来源钻瓜专利网。