[发明专利]语音处理方法、装置、终端设备及存储介质在审
申请号: | 201910746794.9 | 申请日: | 2019-08-13 |
公开(公告)号: | CN110444190A | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | 陈昊亮;罗伟航 | 申请(专利权)人: | 广州国音智能科技有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/04;G10L13/08 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 肖丹 |
地址: | 510000 广东省广州市黄埔*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音处理 语音合成 语音数据 文本信息 终端设备 预设 计算机可读存储介质 个性化需求 用户定制化 语音数据库 查找目标 存储介质 接口接收 目标语音 语音识别 语音信息 语音序列 音信息 语境 语音 指令 场景 输出 | ||
本发明公开了一种语音处理方法、装置、终端设备及计算机可读存储介质,通过获取环境中的语音信息,根据所述语音信息在预设语音数据库中确定语音数据;提取预设接口接收到的文本信息,基于所述文本信息从所述语音数据中查找目标语音数据;按照语音合成指令,将所述目标语音数据合成为语音序列。本发明实现了,不受场景、语境等因素的限制进行语音识别以及语音合成处理,提高了对语音进行的处理的效率,并基于用户定制化和个性化需求进行语音合成和输出,提升了语音处理的性能。
技术领域
本发明涉及语音分析技术领域,尤其涉及一种语音处理方法、装置、终端设备及计算机可读存储介质。
背景技术
计算机技术和数字信号处理技术的发展促成了语音分析技术的发展和实际应用。基于单元挑选的波形拼接语音合成方法由于计算机运算能力和存储容量的提高运用了更大规模的音库及引入更精细的单元挑选策略,在很大幅度上提高了合成语音的音质,音色和自然度。而另一主流语音合成技术,基于隐马尔可夫模型(hidden Markov model,HMM)的参数语音合成方法,也因其更好的鲁棒性能和推广性获得很多研究人员的推崇。
现有的语音分析处理技术,诸如语音合成技术以及语音识别技术等,其构建传统语音合成系统中的音库,主要是依赖人工进行操作,需要安排专业录音人员选择对韵律和音段进行手工标注,其构建所需工作量较大,制作周期较长,对语音进行处理的效率低下,此外,还需要在专业的录制环境下才能完成录音语料的音库录制,严重限制了语音处理的受场景、语境等。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种语音处理方法、终端设备及计算机可读存储介质,旨在解决现有的对语音进行处理的方式,受场景、语境等因素的严重限制,处理效率低下的技术问题。
本发明实施例提出一种语音处理方法,该语音处理方法包括:
获取环境中的语音信息,根据所述语音信息在预设语音数据库中确定语音数据;
提取预设接口接收到的文本信息,基于所述文本信息从所述语音数据中查找目标语音数据;
按照语音合成指令,将所述目标语音数据合成为语音序列。
可选地,在所述获取环境中的语音信息的步骤之前,所述方法还包括:
根据所述环境中的声音音量对所述环境中包含所述语音信息的声音进行降噪处理;
所述获取环境中的语音信息的步骤包括:
从经过降噪处理后的所述声音中,提取所述语音信息。
可选地,所述根据所述语音信息在预设语音数据库中确定语音数据的步骤包括:
识别所述语音信息的文字内容以及音质信息;
检测所述预设语音数据库中是否含有所述文字内容所对应的语音数据;
若不含有,则建立所述文字内容与当前所述语音信息中语音数据之间的对应关系,并将当前所述语音信息中的语音数据存储至所述预设语音数据库中;
若含有,则基于识别到的所述音质信息在所述预设语音数据库中确定语音数据。
可选地,所述基于识别到的所述音质信息在所述预设语音数据库中确定语音数据的步骤,包括:
检测所述预设语音数据库中存储的所述文字内容所对应语音数据的音质信息,是否优于识别到的当前所述语音信息中语音数据的音质信息;
若否,则在所述预设语音数据库中,将所述文字内容所对应语音数据更新为当前所述语音信息中的语音数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州国音智能科技有限公司,未经广州国音智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910746794.9/2.html,转载请声明来源钻瓜专利网。