[发明专利]口音转换方法及装置、电子设备有效

申请号：	201810029495.9	申请日：	2018-01-12
公开（公告）号：	CN108108357B	公开（公告）日：	2022-08-09
发明（设计）人：	王雪云	申请（专利权）人：	京东方科技集团股份有限公司
主分类号：	G06F40/58	分类号：	G06F40/58;G06F40/40;G10L25/18;G10L25/24;G10L15/06;G10L25/30;G10L15/00
代理公司：	北京博思佳知识产权代理有限公司 11415	代理人：	林祥
地址：	100015 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	口音转换方法装置电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及口音转换方法及装置、电子设备。所述方法包括：获取具有第一口音的源语音数据；获取所述源语音数据对应的源语音特征向量；调用特征转换模型，将所述源语音特征向量转换成目标语音特征向量；基于所述目标语音特征向量合成具有第二口音的目标语音数据。根据本发明的实施例，通过对双方的源语音数据进行口音转换，使双方具有相同或者相似的口音，降低因口音不同而引起的沟通障碍，可以提升双方沟通效率。另外，本实施例可以保持双方说话时的语音特点，使双方感受到对方的内容和情感，进一步提升沟通效率。

技术领域

本发明涉及语音处理技术领域，尤其涉及一种口音转换方法及装置、电子设备。

背景技术

随着经济的发展，在工作或者生活中，用户会与不同国家或者地区的用户交流。双方会采用同一种语言进行沟通，并且双方会不自觉地将各自的口音嵌入到该语言中，影响到对方的理解。以英语为例，包括英式英语、美式英语、澳式英语、中式英语、印式英语等。另外，在电话沟通场景中，由于缺少表情、动作等辅助方式的帮忙，影响结果更加明显。

发明内容

本发明提供一种口音转换方法及装置、电子设备，以解决相关技术中的不足。

根据本发明实施例的第一方面，提供一种口音转换方法，所述方法包括：

获取具有第一口音的源语音数据；

获取所述源语音数据对应的源语音特征向量；

调用特征转换模型，将所述源语音特征向量转换成目标语音特征向量；

基于所述目标语音特征向量合成具有第二口音的目标语音数据。

可选地，所述源语音特征向量包括以下至少一个：所述源语音数据的基频特征向量、语速特征向量、能量特征向量和频谱特征向量。

可选地，所述源语音特征向量包括所述源语音数据的基频特征向量，所述获取所述源语音数据对应的源语音特征向量包括：

利用自相关方法获取所述源语音数据的基频特征向量。

可选地，所述源语音特征向量包括所述源语音数据的语速特征向量，所述获取所述源语音数据对应的源语音特征向量包括：

利用可视化语音工具获取所述源语音数据中音节的边界；