[发明专利]一种基于kaldi的在线语音识别的方法在审
申请号: | 202111293511.3 | 申请日: | 2021-11-03 |
公开(公告)号: | CN113889112A | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 刘文婷;黄建青;李帆;张蓓蕾;张锦涛;汪思冒;傅月平;林洲;苏思友 | 申请(专利权)人: | 上海航天电子通讯设备研究所 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L13/02;G10L15/06;G10L15/14;G10L15/16;G10L15/183;G10L15/26;G10L15/30 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 201109 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 kaldi 在线 语音 识别 方法 | ||
本发明涉及一种基于kaldi的在线语音识别的方法,所述方法包括:通过将音频信号经过AD转换后的PCM码流进行网络组包,将音频数据上传服务器;服务器进行在线识别,并根据应答策略进行在线回答语音合成;将数据传回硬件平台后进行DA转换进行播放。在线应答策略用户可配置。采用神经网络算法。命令集可进行用户扩展。单条识别率超过99.7%,识别时间不超过1s,语音合成MOS分值超过4.0。
技术领域
本发明涉及语音识别领域,具体涉及一种基于kaldi的在线语音识别的方法。
背景技术
语音是人类相互交流和通信最方便快捷的手段。如何高效地实现语音传输、存储和通过语音实现人机交互,是语音信号处理领域中的重要研究课题。语音信号处理涉及数字信号处理,语言学、语音学、生理学、心理学、计算机科学以及模式识别、人工智能等诸多学科领域,是目前信息科学技术中发展最为迅速的领域之一。
有关语音识别技术的国外研究起始于上个世纪50年代,而在这一时期的研究内容主要只是关于语音学的一些基本概念和原理。在1952年,美国贝尔实验室研究所Davis等人成功实现了世界上第一个能识别10个英文数字发音的语音识别系统即Audry系统。1960年第一个计算机语音识别系统由英国的Denes等人成功实现。到了70年代语音识别在小词汇量、孤立词等方面取得了实质性的进展。80年代以后,由于词汇量比较大、非特定人的连续语音识别研究成为了重点。在这一阶段,研究思路上发生了一定改变,基于统计模型(HMM)的技术思路被提出来,将神经网络技术引入到语音识别问题中,这就改变了原来基于标准模板匹配的思路。90年代,语音识别的实用化研究却取得了很大进展,很多很有影响力的公司针对语音识别都推出了自己的系统。在苹果的iOS系统中内建一款的人工智能的助理软件Siri。使用该软件用户可以与手机进行对话,使其完成很多服务功能,比如说搜寻资料、查询通讯录、设定闹铃等许多服务。更重要的是它还具有自适应学习的能力,能够不断学习新的语音和语调,能够提供对话式的应答。
随着人工智能领域的发展,语音交互系统逐渐被应用于各个领域。语音交互系统能够极大地方便用户操作,简化操作过程,提升操作效率。
发明内容
为达到上述目的,本申请提出了一种基于kaldi的在线语音交互系统设计方案,提出包含语音识别、智能问答、语音合成模块的在线语音交互系统设计方案,基于加权莱文斯坦距离的拼音相似度匹配算法,基于深度神经网络的降噪算法。
本申请提出了一种基于kaldi的在线语音识别的方法,包括以下步骤:
步骤一:通过将音频信号经过AD转换后的PCM码流进行网络组包,将音频数据上传至服务器;
步骤二:所述服务器进行在线识别;
步骤三:根据应答策略进行在线回答语音合成;
步骤四:将所述合成数据传回硬件平台后进行DA转换并进行播放。
在一个可能的实现方式中,所述步骤一包括:
对OpenFst进行编译,所述OpenFst是用于将信号的构造、组合、优化和搜索;
编译OpenBlas及Clapack库,分别用于矩阵运算以及线性代数计算,至此,所有库均移植到Windows上;
编译onlinebin解码器。
在一个可能的实现方式中,所述步骤二包括:使用人工智能标记语言AIML构建应答系统。
在一个可能的实现方式中,所述步骤四包括:
调用Windows的SAPI接口合成应答语音,将应答文本转换为语音输出,其中,合成语音的质量在MOS值4分以上。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海航天电子通讯设备研究所,未经上海航天电子通讯设备研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111293511.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种恰玛古抗肿瘤成分的提取方法
- 下一篇:一种水网处理及循环利用系统