[发明专利]一种语音情感迁移方法在审
申请号: | 201710222674.X | 申请日: | 2017-04-07 |
公开(公告)号: | CN107221344A | 公开(公告)日: | 2017-09-29 |
发明(设计)人: | 李华康;杜阳阳;金旭;胡晓东;丘添元;张笑源;孙国梓;李涛 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L13/02;G10L15/02;G10L15/06;G10L15/16;G10L19/02;G10L25/27;G10L25/30;G06N3/08 |
代理公司: | 南京知识律师事务所32207 | 代理人: | 李湘群 |
地址: | 210023 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 情感 迁移 方法 | ||
1.一种语音情感迁移方法,其特征在于包含以下步骤:
步骤1、准备一个语音数据库,通过标准采样生成语音情感数据集S={s1,s2,…,sn};
步骤2、采用人工方式对步骤1的语音数据库打标签,标注每个语音文件的情感E={e1,e2,…,en};
步骤3、采用语音特征参数模型对语音库中的每个音频文件si进行音频特征抽取,得到基本的语音特征集Fi={f1i,f2i,…,fni};
步骤4、采用机器学习工具对步骤3得到的每个语音特征集与步骤2得到的语音情感标签进行机器学习,得到每一类语音情感的特征模型,构建情感模型库Eb;
步骤5、通过一个多媒体终端,选择需要语音情感迁移的目标Targete;
步骤6、从多媒体终端输入语音信号st;
步骤7、将当前输入的st输入到语音情感特征提取模块,得到当前语音信号的特征集Ft={f1t,f2t,…,fnt};
步骤8、采用与步骤4相同的机器学习算法,将步骤7得到的st的语音特征集Ft结合步骤步骤4得到的情感模型库Eb进行情感分类,得到st的当前情感类别se;
步骤9、判断步骤8得到的se和步骤5输入的Target是否一致,如果se=Targete,则将原始输入语音信号直接作为目标情感语音输出,如果seTargete,则调用步骤10进行特征情感迁移;
步骤10、将当前语音情感主要特征向情感模型库中的语音情感主要特征进行迁移;
步骤11、采用语音合成算法对步骤10得到的特征迁移后的语音特征进行加工,合成最终目标情感语音输出。
2.根据权利要求1所述的语音情感迁移方法,其特征在于步骤1中语音数据的采样频率为44.1KHz,录音时间在3~10s之间,并且保存为wav格式。
3.根据权利要求1所述的语音情感迁移方法,其特征在于步骤1中为了获得较好的性能,采样数据的自然属性维度不能过于集中。
4.根据权利要求1所述的语音情感迁移方法,其特征在于步骤6中所述输入可以是实时输入,也可以是录制完成后点击递交。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710222674.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:烘干器
- 下一篇:一种阿胶生产用晾胶床