[发明专利]语音关键词检测模型处理方法、装置及计算机设备在审
申请号: | 202110758671.4 | 申请日: | 2021-07-05 |
公开(公告)号: | CN113421554A | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 李泽远;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L13/08;G10L13/02 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 关键词 检测 模型 处理 方法 装置 计算机 设备 | ||
本申请实施例属于人工智能领域,涉及一种语音关键词检测模型处理方法、装置、计算机设备及存储介质,方法包括:获取包含关键词的初始文本、预先存储的语音声纹表征以及包含关键词的真实语音;根据所述语音声纹表征和所述初始文本,合成与所述初始文本相对应的合成语音;将所述真实语音和所述合成语音设置为初始待混合语音,并对所述初始待混合语音进行声学特征调整,得到待混合语音;对所述待混合语音进行混合增强,得到训练语音;根据所述训练语音对初始语音关键词建模型进行训练,得到语音关键词检测模型。此外,本申请还涉及区块链技术,语音声纹表征可存储于区块链中。本申请提高了语音关键词检测模型的训练效率。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种语音关键词检测模型处理方法、装置、计算机设备及存储介质。
背景技术
语音关键词检测是语音识别的一个分支领域,主要用于识别语音信号中是否出现特定词汇以及特定词汇出现的位置。语音关键词检测的应用场景包括唤醒系统、命令词控制系统以及语音敏感词检测等。
语音关键词检测可以通过语音关键词检测模型实现,在此之前需要先通过机器学习得到可用的语音关键词检测模型。机器学习对训练数据具有较高的依赖性,大量且丰富的训练数据可以保证语音关键词检测模型的准确性。因此,在训练之前需要准备大量包含关键词的语音数据,当出现新的关键词检测需求时,还需要随时更新语音数据,这些都需要花费大量的时间和人力成本,导致模型训练的成本较高,语音关键词检测模型训练效率较低。
发明内容
本申请实施例的目的在于提出一种语音关键词建模型处理方法、装置、计算机设备及存储介质,以解决语音关键词检测模型训练效率较低的问题。
为了解决上述技术问题,本申请实施例提供一种语音关键词检测模型处理方法,采用了如下所述的技术方案:
获取包含关键词的初始文本、预先存储的语音声纹表征以及包含关键词的真实语音;
根据所述语音声纹表征和所述初始文本,合成与所述初始文本相对应的合成语音;
将所述真实语音和所述合成语音设置为初始待混合语音,并对所述初始待混合语音进行声学特征调整,得到待混合语音;
对所述待混合语音进行混合增强,得到训练语音;
根据所述训练语音对初始语音关键词建模型进行训练,得到语音关键词检测模型。
为了解决上述技术问题,本申请实施例还提供一种语音关键词检测模型处理装置,采用了如下所述的技术方案:
获取模块,用于获取包含关键词的初始文本、预先存储的语音声纹表征以及包含关键词的真实语音;
语音合成模块,用于根据所述语音声纹表征和所述初始文本,合成与所述初始文本相对应的合成语音;
声学调整模块,用于将所述真实语音和所述合成语音设置为初始待混合语音,并对所述初始待混合语音进行声学特征调整,得到待混合语音;
混合增强模块,用于对所述待混合语音进行混合增强,得到训练语音;
模型训练模块,用于根据所述训练语音对初始语音关键词建模型进行训练,得到语音关键词检测模型。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
获取包含关键词的初始文本、预先存储的语音声纹表征以及包含关键词的真实语音;
根据所述语音声纹表征和所述初始文本,合成与所述初始文本相对应的合成语音;
将所述真实语音和所述合成语音设置为初始待混合语音,并对所述初始待混合语音进行声学特征调整,得到待混合语音;
对所述待混合语音进行混合增强,得到训练语音;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110758671.4/2.html,转载请声明来源钻瓜专利网。