[发明专利]基于机器学习的语音识别方法、装置、设备及介质在审
申请号: | 202210238430.1 | 申请日: | 2022-03-10 |
公开(公告)号: | CN114627862A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 张楠;王健宗;瞿晓阳 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/26;G06N3/00 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 贾依娇 |
地址: | 518000 广东省深圳市福田街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 语音 识别 方法 装置 设备 介质 | ||
本发明涉及人工智能技术领域,揭露一种基于机器学习的语音识别方法,包括:预先选取适用于语音识别的基础网络组成包含不同候选网络的超网络空间,针对超网络空间中不同候选网络形成第一网络模型,采用神经网络搜索框架对输入有语音样本的第一网络模型进行训练及评估,得到候选网络的适应度,使用进化算法从第一网络模型中选取适应度最高的候选网络形成第二网络模型,对第二网络模型针对语音样本进行重新训练,构建语音识别模型,将目标语音片段输入至语音识别模型中进行识别,得到目标语音片段映射的文本表示。本发明能够在训练过程中使用权重共享机制对候选网络进行评估,更精准的寻找到合适的网络模型,提高网络模型的语音识别效果。
技术领域
本发明涉及人工智能技术领域,尤其是涉及到基于机器学习的语音识别方法、装置、计算机设备及计算机存储介质。
背景技术
随着科技的发展进步,语音是一种重要的、被广泛应用的促进人与人之间交流的技术,如今,人们不再满足于彼此交流,而是在生活中与不同的机器建立对话。自动语音识别技术可以将用户的语音转换为一系列的单词,并使机器能够理解,从而创造出一种自然的人机交流。
传统的自动识别技术由几个部分组成,包括特征提取、声学、发音和语音建模。由于构建和调整这些单独的组件是分别训练和使用不同的评估标准,很难获取到最优解,而随着端到端架构的深度学习的出现,自动识别技术取得了很大的突破,主要是由CNN、RNN、Transformer等网络模型驱动的。然而,网络模型的设计需要有经验的专家进行反复试验,很难选取到合适的网络模型,影响语音识别效果。
发明内容
有鉴于此,本发明提供了一种基于机器学习的语音识别方法、装置、计算机设备及计算机存储介质,主要目的在于解决现有技术中网络模型的设计需要有经验的专家进行反复试验,很难选取到合适的网络模型,影响语音识别效果的问题。
依据本发明一个方面,提供了一种基于机器学习的语音识别方法,该方法包括:
预先选取适用于语音识别的基础网络结构组成包含不同候选网络的超网络空间,所述基础网络结构中操作使用不同连接方式形成不同的候选网络;
针对所述超网络空间中不同候选网络形成的第一网络模型,采用神经网络搜索框架对输入有语音样本的第一网络模型进行训练及评估,得到候选网络的适应度,所述神经结构搜索框架使用权重共享机制对候选网络进行评估;
使用进化算法从所述第一网络模型中选取适应度最高的候选网络形成第二网络模型;
对所述第二网络模型针对所述语音样本进行重新训练,构建语音识别模型,所述语音识别模型用于将语音转换为相应的文本表示;
响应于语音识别指令,将目标语音片段输入至所述语音识别模型进行识别,得到所述目标语音片段映射的文本表示。
在本发明另一实施例中,所述预先选取适用于语音识别的基础网络结构组成包含不同候选网络的超网络空间,包括:
预先选取适用于语音识别的可选模块组成基础网络结构,所述可选模块包括不同操作,所述操作包括卷积和同一化核;
通过启用或者禁止的方式控制所述基础网络结构中操作使用不同连接方式,形成包含不同候选网络的超网络空间。
在本发明另一实施例中,在所述针对所述超网络空间中不同候选网络形成的第一网络模型,采用神经网络搜索框架对输入有语音样本的第一网络模型进行训练及评估,得到候选网络的适应度之前,所述方法还包括:
针对预先采集的语音信号进行采样,并使用预设窗口和固定时间帧移进行分析,提取语音信号特征作为语音样本。
在本发明另一实施例中,所述针对所述超网络空间中不同候选网络形成的第一网络模型,采用神经网络搜索框架对输入有语音样本的第一网络模型进行训练及评估,得到候选网络的适应度,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210238430.1/2.html,转载请声明来源钻瓜专利网。