[发明专利]一种基于人工智能的自动语音识别方法及系统有效

专利信息
申请号: 202010019733.5 申请日: 2020-01-09
公开(公告)号: CN110827801B 公开(公告)日: 2020-04-17
发明(设计)人: 漆伟;马永霄;童永鳌;张瑞冬;殷子凌;张浩 申请(专利权)人: 成都无糖信息技术有限公司
主分类号: G10L15/02 分类号: G10L15/02;G10L15/06;G10L15/16;G10L15/18;G10L15/22;G10L15/26;G10L25/24
代理公司: 成都为知盾专利代理事务所(特殊普通合伙) 51267 代理人: 李汉强
地址: 610000 四川省成都市高新*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 人工智能 自动 语音 识别 方法 系统
【说明书】:

发明公开了一种基于人工智能的自动语音识别方法及系统,它主要包括了语音预处理模块、语音特征提取模块、语音训练识别模块和文本矫正模块四大模块。本发明采用语音训练识别模块对语音特征及语音对应文字编码进行学习,先通过特征学习层进行卷积学习频谱特征,然后通过语义学习层学习频谱特征间语义信息,最后通过输出层对综合学到的信息进行解码,输出对应文本。这样在直接使用汉字映射表进行标签的编码和解码,不需要对文本进行音素编码解码,然后再解码为文本,简化了训练流程。

技术领域

本发明涉及人工智能中的语音识别技术领域,具体涉及一种基于人工智能的自动语音识别技术。

背景技术

人工智能(ArtificialIntelligence,简称AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、计算机视觉、自然语言处理和专家系统等。

现有自动语音识别技术的发展主要倾向于训练和解码两个阶段;训练,即通过大量标注的语音数据训练声学模型,其中包括GMM-HMM、DNN-HMM和RNN+CTC等;解码,即通过声学模型和语言模型将训练集外的语音数据识别成文字。

以孤立词识别为例,能够很好地阐述语音识别的流程和相关概念。假如对词进行建模,在训练阶段学习每个模型的参数;在识别阶段,计算输入语音序列在每个模型的得分(概率值),最高分者获胜。但是,任何语言里的常用单词都以千计,学习数以千计的模型不仅需要庞大的语料库,还需要漫长的迭代时间。此外,汉语还分有调无调,同音字等,导致模型数量成倍增加。这给用户带来了诸多不便,使得语音识别技术无法大规模产业化。

发明内容

为克服上述存在之不足,本发明的发明人通过长期的探索尝试以及多次的实验和努力,不断改革与创新,提出一种基于深度学习的端到端的自动语音识别技术,以解决上述背景技术中提出的问题。

为实现上述目的本发明所采用的技术方案是:

一种基于人工智能的自动语音识别方法,其包括以下步骤:

S1、语音预处理:对原始语音序列做预处理,以消除因为人类发声器官本身和由于采集语音信号的设备对语音信号质量产生影响的因素,保证后续语音处理得到的信号更均匀、平滑,为信号参数提取提供优质的参数,提高语音处理质量;

S2、语音特征提取:采用梅尔倒谱系数(Mel-scaleFrequency CepstralCoefficients)来获取语音的声谱特征图, 然后对输入的语音信号进行滤波,将每个输出的信号能量作为信号的基本特征,对该基本特征进行计算频谱图后作为下一步的语音输入特征;

S3、语音训练识别:输入提取的语音特征及语音对应的文字编码进行学习,具体是先通过特征学习层进行卷积学习频谱特征,然后通过语义学习层学习频谱特征间语义信息,最后通过输出层对综合学到的信息进行解码,输出对应文本;

S4、文本矫正:语音识别输出是对频谱特征到字典表的映射,输出的文字不够通顺和语义信息比较缺乏,因此还需要把语音训练识别输出文本输入到语言模型,然后输出比较通顺的文字,再把经过语言模型的文字输入到拼写纠错模型,最终得到通顺且语义逻辑连贯的文本。

根据本发明所述的一种基于人工智能的自动语音识别方法,其中进一步地优选技术方案是所述语音预处理具体操作是:

对语音进行端点检测,找到语音信号的起始点和结束点;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都无糖信息技术有限公司,未经成都无糖信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010019733.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top