[发明专利]一种基于AI视频声道变声器在审
申请号: | 202111591729.7 | 申请日: | 2021-12-23 |
公开(公告)号: | CN114333836A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 蔡彬;胡亚平;彭培超 | 申请(专利权)人: | 天翼视讯传媒有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L13/027 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹;柏子雵 |
地址: | 200120 上海市浦东新区中国*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ai 视频 声道 变声 | ||
1.一种基于AI视频声道变声器,其特征在于,包括:
语音录制模块,由目标实施人物念出汉语拼音的63个字母后,通过语音录制模块获得每个汉语拼音所对应的语音信号;
语音包生成模块,将通过语音录制模块获得的每个汉语拼音字母与对应的语音信号关联存储后形成语音包,将该语音包存储在智能终端内;
语音分解模块,用于获取当前智能终端所发出的一段机器人语音,将该段机器人语音转变为文字后,对文字进行分字处理,获得组成每一个字的汉语拼音字母,并且获得每个字所对应的机器人语音信号;
语音信号识别模块,用于识别语音信号的信号参数;
当语音分解模块获得每个字所对应的机器人语音信号后,调用语音信号识别模块获得每个字所对应的机器人语音信号的信号参数;
语音合成模块,用于调用语音包生成模块所生成的语音包后合成与语音分解模块获得的每个字所对应的目标实施人物语音信号,包括以下步骤:
步骤1、语音合成模块获得语音分解模块给出的每个字所对应的所有汉语拼音字母;
步骤2、依据步骤1所获得的汉语拼音字母,从语音包生成模块所生成的语音包中调用与每个汉语拼音字母对应的目标实施人物的语音信号;
步骤3、对于步骤1中所述任意一个字而言,获得组成当前字的所有汉语拼音字母所对应的目标实施人物的语音信号,调用语音信号识别模块获得每个语音信号的语音参数,再基于语音参数利用语音合成算法将同一个字对应的所有目标实施人物的语音信号合成一个目标实施人物语音信号;
当语音合成模块获得每个字所对应的目标实施人物语音信号后,调用语音信号识别模块获得每个字所对应的目标实施人物语音信号的信号参数;
语音修正模块,获得同一个字的机器人语音信号的信号参数以及目标实施人物语音信号的信号参数后,由语音修正模块基于两个信号参数的差异计算得到信号修正数据,再利用信号修正数据对机器人语音信号进行修正;
语音合成模块,利用语音修正模块实现对组成语音分解模块所获得一段文字的所有字的机器人语音信号的修正后,由语音合成模块依据字的顺序重新将所有修正后的机器人语音信号合成一段语音信号后进行播放。
2.如权利要求1所述的一种基于AI视频声道变声器,其特征在于,所述信号参数包括基音周期、基频和共振峰频率。
3.如权利要求2所述的一种基于AI视频声道变声器,其特征在于,所述语音信号识别模块先对输入的语音信号进行低通滤波,随后进行自相关计算,基于自相关信号对输入的语音信号的基音周期进行估计;语音信号识别模块再基于估计得到的基音周期,依据基音周期、基频和共振峰频率之间的函数关系,计算得到与当前基音周期对应的基频和共振峰频率。
4.如权利要求3所述的一种基于AI视频声道变声器,其特征在于,语音修正模块利用同一个字的机器人语音信号以及目标实施人物语音信号的基音周期、基频和共振峰频率形成前述的信号修正数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼视讯传媒有限公司,未经天翼视讯传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111591729.7/1.html,转载请声明来源钻瓜专利网。