[发明专利]一种语音分离方法及系统有效
申请号: | 201811430304.6 | 申请日: | 2018-11-28 |
公开(公告)号: | CN109326303B | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 崔颖 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L17/00 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 郭桂峰 |
地址: | 523851 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 分离 方法 系统 | ||
本发明提供了一种语音分离方法及系统,其方法包括:获取用户声音的基本波形以及对应的用户信息,根据所述基本波形和所述用户信息建立基本波形库;获取多人混合语音;将所述多人混合语音和所述基本波形库进行匹配,将所述多人混合语音分离为多个单人语音。本发明从一个多人混合语音中分离出每个用户各自产生的单人语音,从而便于用户对单人语音进行处理。
技术领域
本发明涉及语音识别技术领域,尤指一种语音分离方法及系统。
背景技术
用户在使用家教机朗读工具的时候,点击开始朗读进行录音,直至朗读结束进行回放,但是此过程中没有对收集回来的音频信息进行任何的处理,回放的时候是多种声音混合的效果。在课堂上、课后,学生们喜欢一起大声朗读,此时朗读录音,家教机接收的是来自不同用户的声音,朗读回放的时候也会呈现多个用户同时朗读合成的混杂的声音,无法辨别单个用户朗读的准确性。因此,急需一种对混合的语音进行分离的方法及系统。
发明内容
本发明的目的是提供一种语音分离方法及系统,实现从一个多人混合语音中分离出每个用户各自产生的单人语音,从而便于用户对单人语音进行处理。
本发明提供的技术方案如下:
本发明提供一种语音分离方法,包括:
获取用户声音的基本波形以及对应的用户信息,根据所述基本波形和所述用户信息建立基本波形库;
获取多人混合语音;
将所述多人混合语音和所述基本波形库进行匹配,将所述多人混合语音分离为多个单人语音。
进一步的,所述的获取用户声音的基本波形以及对应的用户信息,根据所述基本波形和所述用户信息建立所述基本波形库具体包括:
获取用户语音以及对应的用户信息;
分析所述用户语音,得到对应的用户的声音的基本波形;
根据所述基本波形和所述用户信息建立所述基本波形库,在所述基本波形库建立所述基本波形和所述用户信息之间的映射关系。
进一步的,所述的将所述多人混合语音和所述基本波形库进行匹配,将所述多人混合语音分离为多个单人语音具体包括:
根据所述多人混合语音得到对应的混合语音波形;
将所述混合语音波形和所述基本波形库进行匹配,将所述多人混合语音分离为多个单人语音。
进一步的,还包括:
获取所述多人混合语音对应的混合语音用户信息,得到所述多人混合语音中包含的人数;
统计分离出的所述单人语音的个数;
当所述个数小于所述人数时,根据所述基本波形库获取将所述单人语音对应的单人语音用户信息;
将所述单人语音用户信息和所述混合语音用户信息进行对比,获取所述多人混合语音中未分离的语音对应的未分离语音用户信息;
根据所述未分离语音用户信息获取对应的未分离语音基本波形;
根据所述未分离语音基本波形和对应的所述未分离语音用户信息更新所述基本波形库;
根据所述未分离语音基本波形分离所述多人混合语音。
进一步的,所述的将所述多人混合语音和所述基本波形库进行匹配,将所述多人混合语音分离为多个单人语音之后包括:
将所述用户信息作为标记信息标记对应的所述单人语音;
根据所述标记信息存储所述单人语音;
根据存储的所述单人语音分析对应的用户的语音质量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811430304.6/2.html,转载请声明来源钻瓜专利网。