[发明专利]一种大数据分析语音识别方法在审
申请号: | 202010579264.2 | 申请日: | 2020-06-23 |
公开(公告)号: | CN111754987A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 李磊;马如燕 | 申请(专利权)人: | 国投(宁夏)大数据产业发展有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/06;G10L25/18;G10L25/30;G10L25/51 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 750000 宁夏回族自治区银川市*** | 国省代码: | 宁夏;64 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 分析 语音 识别 方法 | ||
本发明公开了一种大数据分析语音识别方法,包括:A、采集待识别的语音信号后,将待识别的语音信号发送至分类模块,分类模块将待识别的语音信号分为简单词汇信号和复杂词汇信号,简单词汇信号发送至第一识别模块,复杂词汇信号发送至第二识别模块;B、第一识别模块将简单词汇信号与数据库中的数据进行对比,得到与简单词汇信号相似度高于设定阈值的初筛数据集;C、第二识别模块根据初筛数据集确定识别参数,第二识别模块对复杂词汇信号进行识别后,在初筛数据集中选择与复杂词汇信号识别结果相关性最大的数据,与复杂词汇信号识别结果组成最终的识别结果。本发明能够改进现有技术的不足,提高语音识别的速度和准确度。
技术领域
本发明涉及语音识别技术领域,尤其是一种大数据分析语音识别方法。
背景技术
随着智能机器人技术的发展,通过语音直接控制机器人行为这一便捷的控制方式逐步普及开来。不过,由于现有语音识别技术的限制,机器人对于语音控制指令的识别速度和识别率均不高,这就导致语音控制只能作为一种辅助控制手段存在,限制了语音控制机器人的应用。
发明内容
本发明要解决的技术问题是提供一种大数据分析语音识别方法,能够解决现有技术的不足,提高语音识别的速度和准确度。
为解决上述技术问题,本发明所采取的技术方案如下。
一种大数据分析语音识别方法,包括以下步骤:
A、采集待识别的语音信号后,将待识别的语音信号发送至分类模块,分类模块将待识别的语音信号分为简单词汇信号和复杂词汇信号,简单词汇信号发送至第一识别模块,复杂词汇信号发送至第二识别模块;
B、第一识别模块将简单词汇信号与数据库中的数据进行对比,得到与简单词汇信号相似度高于设定阈值的初筛数据集,将初筛数据集发送至第二识别模块;
C、第二识别模块根据初筛数据集确定识别参数,第二识别模块对复杂词汇信号进行识别后,在初筛数据集中选择与复杂词汇信号识别结果相关性最大的数据,与复杂词汇信号识别结果组成最终的识别结果。
作为优选,步骤A中,分类模块对待识别的语音信号进行傅里叶变换,在变换得到的信号频谱中检索特征频谱段,若同一时间段内存在至少两个特征频谱,则将这一时间段的语音信号定义为简单词汇信号,遍历整个待识别的语音信号后,将未定义为简单词汇信号的部分定义为复杂词汇信号。
作为优选,步骤B中,使用简单词汇信号对应的特征频谱在数据库中进行比对,对每个特征频谱设置对应的一级权重值,对同一简单词汇信号内不同的特征频谱设置统一的二级权重值,在计算相似度时首先使用一级权重值对相似度进行加权计算,然后对计算结果再通过二级权重值进行二次加权计算。
作为优选,步骤C中,第二识别模块建立神经网络模型,使用在数据库中与初筛数据集关联性大于设定阈值的数据对神经网络模型进行训练,确定模型参数;将复杂词汇信号输入神经网络模型进行计算,得到预测结果集;建立每个预测结果与其时间维度上相邻数据的关联映射,对预测结果进行调整,使关联映射全部收敛,调整后的预测结果集为复杂词汇信号识别结果。
作为优选,复杂词汇信号输入神经网络模型前,提取复杂词汇信号的非线性特征和线性特征,使用线性特征的组合代替非线性特征。
作为优选,在非线性特征两端设置接口部,接口部具有非线性特征的特征点集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国投(宁夏)大数据产业发展有限公司,未经国投(宁夏)大数据产业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010579264.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置