[发明专利]一种基于互联网的语音实时合成系统在审
申请号: | 202010547215.0 | 申请日: | 2020-06-16 |
公开(公告)号: | CN111754977A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 蒲瑶;何国涛;李全忠 | 申请(专利权)人: | 普强信息技术(北京)有限公司 |
主分类号: | G10L13/04 | 分类号: | G10L13/04;G10L13/08;G10L13/10;G10L15/26;G06F40/30;G10L15/34;G10L15/30 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 互联网 语音 实时 合成 系统 | ||
1.一种基于互联网的语音实时合成系统,包括控制模块,其特征在于:所述控制模块上电性连接有调压模块和市电网,所述控制模块上电性连接有分析模块和咪头,所述控制模块上电性连接有语音模块和蜂鸣器,所述控制模块上电性连接有传输模块和云互联网,所述控制模块上电性连接存储模块和显示模块;
所述分析模块内包括有语句特征提取、语句语义检测、语句断句、声纹检测模块、和语句转化文字,所述语句特征提取用于将输入的语音中的特征进行提取,所述语句语义检测通过对语句特征提取的语句中的语义进行翻译,所述声纹检测模块用于对声音的语种进行检测,且使得输出的语音以相同的语种输出,所述语句转化文字用于将语音转化成文字进行传输;
所述语音模块内包括有文本规划模块、文字断句填充、语意语法对比、文字语音转化和语句语调调节,所述文本规划模块用于对回答的语句文本进行规划长短,所述文字断句填充用于提取回答话语中的主谓宾进行填充,然后在进行修饰词的填充,所述语意语法对比用于对问答话语中的语意进行对比并且做出相应的回答,所述文字语音转化用于将文字转化成语音,并且通过蜂鸣器进行输出,所述语句语调调节用于对回答的话语进行语调的修成,使得话语能够具有高低语调,方便对话者快速的理解;
所述传输模块内部包括有数模转化模块、语音除杂模块、数据放大模块和通讯模块,所述数模转化模块用于将文字转化成数据流便于传输,所述语音除杂模块用于将数据流中的杂波进行过滤除去,所述数据放大模块用于将数据流进行放大处理,使得数据流在接收的时候不会发生丢失或者失真,所述通讯模块用于将数据流进行传输,使得合成语音能够实现互联网进行传输。
2.根据权利要求1所述的一种基于互联网的语音实时合成系统,其特征在于:所述调压模块内包括有整流模块、降压模块、稳压模块和滤波模块,所述整流模块采用的是同步整流器将交流电压转化成直流电压,所述降压模块用于将电压降至3-5V之间用于控制模块使用,所述稳压模块和滤波模块用于将电压稳定的输出。
3.根据权利要求1所述的一种基于互联网的语音实时合成系统,其特征在于:所述储存模块至少包括有四组,一组用于对控制模块的运行系统进行存储,一组用于对分析模块中的声纹、特征、语义和训练模块进行存储、一组用于对语音模块中的文字、语法和语调模型进行存储,另一组用于通讯记录和更新记录进行存储。
4.根据权利要求1所述的一种基于互联网的语音实时合成系统,其特征在于:所述蜂鸣器内包括有驱动器,所述驱动器用于对蜂鸣器进行驱动。
5.根据权利要求1所述的一种基于互联网的语音实时合成系统,其特征在于:所述显示模块采用的是触摸液晶显示屏,所述液晶显示模块用于对合成系统进行数据显示。
6.根据权利要求1所述的一种基于互联网的语音实时合成系统,其特征在于:所述通讯模块采用的是无线传输、4G传输或者5G传输中的一种。
7.根据权利要求1所述的一种基于互联网的语音实时合成系统,其特征在于:所述文字语音转化和语句转化文字采用的是基于PSOLA方法的时域波形拼接技术的KDTALK系统。
8.根据权利要求1所述的一种基于互联网的语音实时合成系统,其特征在于:所述语音模块采用的是TTS结构,所述TTS结构包括有语言处理、韵律处理和声学处理,所述语言处理包括有文本规整、词的切分、语法分析和语义分析,所述韵律处理为合成语音规划出音段特征,所述声学处理根据语言处理和韵律处理两部分处理结果的要求输出语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普强信息技术(北京)有限公司,未经普强信息技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010547215.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:显示面板
- 下一篇:一种基于深度学习的存储系统自适应参数调优方法