[发明专利]语音声色转换方法及装置在审
申请号: | 201810476183.2 | 申请日: | 2018-05-17 |
公开(公告)号: | CN108682426A | 公开(公告)日: | 2018-10-19 |
发明(设计)人: | 张裕 | 申请(专利权)人: | 深圳市沃特沃德股份有限公司 |
主分类号: | G10L21/003 | 分类号: | G10L21/003;G10L15/26;G06F17/28;G10L15/00 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉 |
地址: | 518000 广东省深圳市南山区蛇口*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 转换方法及装置 翻译设备 音频文件 语音文件 转换 接收语音信号 语音播放 语音信号 娱乐性 成对 播放 翻译 应用 | ||
本发明公开了一种语音声色转换方法及装置,应用于翻译设备,其中语音声色转换方法包括:接收语音信号;对语音信号进行翻译处理并形成对应的音频文件;若确定对音频文件进行语音声色转换,则将音频文件转换成对应声色的第一语音文件;播放第一语音文件。本发明的语音声色转换方法及装置可以丰富翻译设备的语音播放声色,提高了翻译设备的娱乐性,满足人们多样化的声色需求。
技术领域
本发明涉及通信技术领域,特别是涉及一种语音声色转换方法及装置。
背景技术
现在市场上存在各种各样的翻译设备,这些翻译设备通过接收翻译对象的语音信号,并翻译成用户想要语种的声音文件,进而为用户进行播放,促进用户与翻译对象之间的沟通交流。但是,现在的这些翻译设备的播放声音一般只支持两种或三种声色的声音,例如百度翻译支持普通男声、普通女声和儿童声音这三种声色的语音播放,微软只支持普通男声和普通女声两种声色的语音播放,声色类型比较少,娱乐性较低,难以满足人们复杂的需求,比如萝莉、大叔、惊悚、搞怪、空灵等声色的语音播放,适合人们的特殊需求,娱乐性也比较高。
发明内容
本发明的主要目的在于提供一种语音声色转换方法及装置,以增加翻译设备语音播放的声色,满足人们的多样化需求。
为达到上述目的,本发明所采取的技术方案是:一种语音声色转换方法,应用于翻译设备,包括:
接收语音信号;
对语音信号进行翻译处理并形成对应的音频文件;
若确定对音频文件进行语音声色转换,则将音频文件转换成对应声色的第一语音文件;
播放第一语音文件。
进一步地,播放第一语音文件的步骤,包括:
若当前正在播放第二语音文件,则根据预置语音文件播放规则设定所述第一语音文件的播放等级和所述第二语音文件的播放等级;
若所述第一语音文件的播放等级高于所述第二语音文件的播放等级,则停止播放所述第二语音文件,并播放所述第一语音文件。
进一步地,对语音信号进行翻译处理并形成对应的音频文件的步骤之后,包括:
按照预设规则将音频文件加载于翻译设备的音频引擎中。
进一步地,按照预设规则将音频文件加载于翻译设备的音频引擎中的步骤,包括:
获取音频文件的大小信息;
根据大小信息选择对应的加载形式,将音频文件加载于翻译设备的音频引擎中。
进一步地,对语音信号进行翻译处理并形成对应的音频文件的步骤,包括:
将语音信号转换为对应的数字信号并发送给第三方语音识别引擎;
接收第三方语音识别引擎对数字信号进行解析形成的识别文本;
将识别文本发送给翻译服务器;
接收翻译服务器按照翻译指令将识别文本翻译为对应的翻译文本;
将翻译文本发送给第三方合成引擎;
接收第三方合成引擎将翻译文本合成的音频文件。
本发明还提出一种语音声色转换装置,应用于翻译设备,包括:
第一接收单元,用于接收语音信号;
第一处理单元,用于对语音信号进行翻译处理并形成对应的音频文件;
第一转换单元,用于若确定对音频文件进行语音声色转换,则将音频文件转换成对应声色的第一语音文件;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市沃特沃德股份有限公司,未经深圳市沃特沃德股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810476183.2/2.html,转载请声明来源钻瓜专利网。