[发明专利]一种基于语音雷达与视频的语音合成方法有效
申请号: | 201711100477.7 | 申请日: | 2017-11-09 |
公开(公告)号: | CN109767750B | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 洪弘;李慧;顾陈;赵恒;顾旭;高茜;奚梦婷;李彧晟;孙理;朱晓华 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G06K9/00;G01S7/41 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 马鲁晋 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于语音雷达的新型语音合成方法,处理步骤如下:由雷达回波信号获得声带振动频率作为语音基频;由发音者发音时嘴唇视频信息提取的运动特征和麦克风同步获取语音信号提取的共振峰进行拟合,获得嘴唇的运动特征和共振峰映射关系的经验公式;将测试者发音时的嘴唇视频作为输入,获得时变共振峰;最后由获得的基频和时变共振峰进行语音合成。利用本发明的方法,可以不接触发音者体,将语音雷达与图像信息相结合,实现语音合成。 | ||
搜索关键词: | 一种 基于 语音 雷达 视频 合成 方法 | ||
【主权项】:
1.一种基于语音雷达与视频的语音合成方法,其特征在于,包括以下步骤:步骤1、利用雷达回波信号获取语音的基频信息,具体为:非接触式语音雷达向发音者发送连续正弦波,接收天线接收回波信号,之后对接收到的回波信号进行预处理、基频与高次谐波模式分解、时频信号处理,从而获得时变声带振动的频率即语音信号的基频;步骤2、将发音者发音时嘴唇视频信息提取的时变运动特征和麦克风同步获取语音信号提取的时变共振峰进行拟合,获得嘴唇的时变运动特征和时变共振峰映射关系的经验公式;步骤3、将待合成语音的发音者嘴唇视频信息为输入,利用步骤2中的得到嘴唇的时变运动特征和时变共振峰映射关系的经验公式进行计算,得到发音者语音的N组时变共振峰,其中N为不小于三的整数;步骤4、由雷达回波获取的语音信号的基频和步骤3获得的N组时变共振峰进行语音合成,得到最终合成的语音信号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711100477.7/,转载请声明来源钻瓜专利网。