[发明专利]一种基于人工智能的自动语音识别方法及系统有效
申请号: | 202110293229.9 | 申请日: | 2021-03-18 |
公开(公告)号: | CN112951237B | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 张子奇;聂鹏 | 申请(专利权)人: | 深圳奇实科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/02;G10L15/16;G10L15/06;G10L15/08;G10L15/18;G10L21/0208;G10L25/57 |
代理公司: | 北京广技专利代理事务所(特殊普通合伙) 11842 | 代理人: | 崔征 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工智能 自动 语音 识别 方法 系统 | ||
1.一种基于人工智能的自动语音识别方法,其特征在于,包括:
接收待识别的语音信号;
对所述待识别的语音信号进行预处理,获得语音输入信号;
将所述语音输入信号进行时域到频域的转换,提取语音特征参数;
对所述语音特征参数进行随机取样,获得若干个样本特征参数;
将所述样本特征参数输入至声学模型和语言模型,经过解码搜索获取识别结果;
将所述识别结果输入至词汇分类模板,将所述识别结果中的词汇与 所述词汇分类模板中的专业词汇进行比对,获得识别结果中的词汇中专业词汇的占比;
判断所述占比是否超出预设值,若是,将所述语音特征参数输入至专业词汇声学模型和专业词汇语言模型,经过输出层的搜索对综合信息进行解码,输出对应的文本;所述专业词汇声学模型和专业词汇语言模型中对专业词汇的权重进行了重新匹配,提高获得专业词汇的概率;
若否,将所述语音特征参数输入至声学模型和语言模型,经过解码搜索获取识别结果,并输出对应的文本;
所述对所述待识别的语音信号进行预处理的方法包括:
A1,获取环境中有规律噪声的频谱;
A2,获取收音装置噪声的频谱;
A3,基于环境噪声的频谱和收音装置噪声的频谱,结合最小方差无畸变响应滤波器增强后的信号采用下述公式确定:
其中,为环境中有规律噪声的频谱;为收音装置噪声的频谱;为滤波器的加权系数;是获得的语音输入信号;为待降噪的信号;
为当前频率,为当前时间,为当前帧,P为收音装置的数量,,为有规律噪声出现的次数,;是训练误差取最小值时对应的初始系数,表示训练误差的最小值;
A4,基于所述获得的语音输入信号,采用下述公式对所述语音输入信号的噪声判定值,若每个信号数据的噪声判定值大于预设的判定阈值,则将该信号数据判定为噪声点,其中值的计算公式为:
其中,代表信号数据集合中的第个信号数据;代表信号数据集合中的第个信号数据,代表信号数据集合中的第个信号数据,,;代表信号数据集合中第个信号数据的噪声判定值,代表自然常数,代表指数函数,代表信号数据集合中信号数据的中值;
A5,将数据集合中的每个信号数据都进行一一判定,当为噪声点时,则进行剔除,不为噪声点时,则进行保留,将保留后的信号数据形成最后处理后的信号。
2.根据权利要求1所述的基于人工智能的自动语音识别方法,其特征在于,将输出的所述文本输入至拼写纠错模型,获得纠错后文本;
将纠错后的文本作为最终文本输出。
3.根据权利要求1所述的基于人工智能的自动语音识别方法,其特征在于,所述词汇分类模板构建方法包括:
获取大量分属于不同行业的专业词汇;
将所述专业词汇采用卷积神经网络按照专业词汇所属的行业进行分类训练;
获得分类结果,并将所述分类结果存储于分类数据库中,构成词汇分类模板。
4.根据权利要求3所述的基于人工智能的自动语音识别方法,其特征在于,所述专业词汇声学模型构建方法包括:
将词汇分类模板中的分类数据库设置为专业词汇字典;
基于音素或其组合从所述专业词汇字典中进行映射;
若所述专业词汇字典中无映射内容,则基于声学模型中的字典进行映射;
根据上述映射结果获取相应音素及其组合的声学得分。
5.根据权利要求4所述的基于人工智能的自动语音识别方法,其特征在于,所述专业词汇语言模型的构建方法包括:
基于词汇分类模板中分类数据库中存储的专业词汇,结合词典获取专业词汇的词序及连接词;所述词序及连接词的概率值排序为前五位;
将获取到的词序及连接词结合专业词汇记录在专业词汇语言数据库中;
基于所述声学得分及所述专业词汇语言数据库,确定语言得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳奇实科技有限公司,未经深圳奇实科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110293229.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电能表更换多功能作业钳
- 下一篇:一种纵梁加强结构及汽车