[发明专利]语音识别训练和应用方法及装置有效
申请号: | 202011479654.9 | 申请日: | 2020-12-15 |
公开(公告)号: | CN112687261B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 陆沁 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/07;G10L15/22;G10L15/26 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;邓婷婷 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 训练 应用 方法 装置 | ||
本发明公开语音识别训练和应用方法及装置,其中,一种语音识别训练方法,包括:获取经由开发者预设的多个场景,以及与所述多个场景对应的第一语音识别资源和与所述多个场景中每一个场景对应的多个第二语音识别资源,其中,所述第一语音识别资源为所述多个场景能够通用的部分,所述第二语音识别资源为所述每一个场景所独有的部分;训练与所述第一语音识别资源对应的第一模型和与所述多个第二语音识别资源对应的多个第二模型;将训练后的所述第一模型和所述第一语音识别资源存储到每个服务器中,将训练后的所述多个第二模型和所述多个第二语音识别资源存储到至少一个服务器中;从而可以实现减少语音识别资源更新时的重复性工作,降低了维护成本。
技术领域
本发明属于语音识别技术领域,尤其涉及语音识别训练和应用方法及装置。
背景技术
近年来,随着语音识别技术的不断发展,语音交互已广泛应用于我们的生活及工作中,特别是智能家居、智能车载、智能手机、儿童机器人、智能客服等领域。
为支持不同场景的语音交互,目前大部分的语音识别系统针对每个场景提供一个专用系统。为保证识别的准确率,每个场景的专用语音识别系统,均需支持该场景下可能用到的交互指令,这会导致每个场景的语音识别系统都较大,且不同场景间存在一定程度的重复,从而导致资源维护成本高。另外,由于各场景语音识别资源较大,加载至识别服务器耗时较长,通常将场景语音识别资源存储于固定的识别服务器上。为支撑各个场景的语音识别服务,固定的识别服务器分配方式通常会分配冗余的识别服务器给每个场景,且无法根据实际调用量调整,从而导致服务器资源浪费、利用率低等问题。
发明内容
本发明实施例提供一种语音识别训练和应用方法及装置,用于至少解决上述技术问题之一。
第一方面,本发明实施例提供一种语音识别训练方法,包括:获取经由开发者预设的多个场景,以及与所述多个场景对应的第一语音识别资源和与所述多个场景中每一个场景对应的多个第二语音识别资源,其中,所述第一语音识别资源为所述多个场景能够通用的部分,所述第二语音识别资源为所述每一个场景所独有的部分;训练与所述第一语音识别资源对应的第一模型和与所述多个第二语音识别资源对应的多个第二模型;将训练后的所述第一模型和所述第一语音识别资源存储到每个服务器中,将训练后的所述多个第二模型和所述多个第二语音识别资源存储到至少一个服务器中。
第二方面,本发明实施例提供一种语音识别应用方法,包括:响应于用户的语音输入,获取与所述用户的语音输入对应的场景;基于所述场景将所述用户的语音输入送入支持所述场景所独有的部分资源的服务器进行语音识别,其中,每个服务器均支持多个场景能够通用的部分资源以及至少一个服务器支持每个场景所独有的部分资源;获取支持所述场景所独有的部分的服务器返回的语音识别结果,将所述语音识别结果反馈给所述用户。
第三方面,本发明实施例提供一种语音识别训练装置,包括:第一获取模块,配置为获取经由开发者预设的多个场景,以及与所述多个场景对应的第一语音识别资源和与所述多个场景中每一个场景对应的多个第二语音识别资源,其中,所述第一语音识别资源为所述多个场景能够通用的部分,所述第二语音识别资源为所述每一个场景所独有的部分;训练模块,配置为训练与所述第一语音识别资源对应的第一模型和与所述多个第二语音识别资源对应的多个第二模型;存储模块,配置为将训练后的所述第一模型和所述第一语音识别资源存储到每个服务器中,将训练后的所述多个第二模型和所述多个第二语音识别资源存储到至少一个服务器中。
第四方面,本发明实施例提供一种语音识别应用装置,包括:第二获取模块,配置为响应于用户的语音输入,获取与所述用户的语音输入对应的场景;送入模块,配置为基于所述场景将所述用户的语音输入送入支持所述场景所独有的部分资源的服务器进行语音识别,其中,每个服务器均支持多个场景能够通用的部分资源以及至少一个服务器支持每个场景所独有的部分资源;获取反馈模块,配置为获取支持所述场景所独有的部分的服务器返回的语音识别结果,将所述语音识别结果反馈给所述用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011479654.9/2.html,转载请声明来源钻瓜专利网。