[发明专利]一种数字串语音识别方法、身份验证装置及计算机可读存储介质有效
申请号: | 202010224785.6 | 申请日: | 2020-03-26 |
公开(公告)号: | CN111429913B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 曾志先;肖龙源;李稀敏;叶志坚;刘晓葳 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/06;G10L17/00 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 吴圳添 |
地址: | 361009 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 种数 字串 语音 识别 方法 身份验证 装置 计算机 可读 存储 介质 | ||
本发明涉及人计算机技术领域,提供了一种数字串语音识别方法,包含步骤:获取待识别语音;将所述语音输入至数字串语音识别模型进行识别,以得到所述待识别语音对应的数字串文本,其中,构建所述数字串语音识别模型的算法包含卷积神经网络、长短期记忆网络及全连接网络,所述待识别语音进入所述数字串语音识别模型后,先后经由卷积神经网络、长短期记忆网络及全连接网络的计算,得到所述数字串文本。基于本发明实施例所提供的数字串语音识别方法通过对数字串语音识别模型的算法构建进行设计,在识别过程中结合了音频数据的局部特征及时间维度特征,可提升识别准确率。
技术领域
本发明涉及计算机信息技术领域,尤其涉及一种数字串语音识别方法、身份验证装置及计算机可读存储介质。
背景技术
语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
随着数据处理技术的进步以及移动互联网的快速普及,计算机技术被广泛地运用到了社会的各个领域,随之而来的则是海量数据的产生。其中,语音数据受到了人们越来越多的重视。语音识别是一门交叉学科。近二十年来。语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。
数字串的语音识别的应用也越来越广泛,尤其是在身份验证中,传统的数字串识别技术是直接通过语音识别在大范围语料的学习基础上,进行数字的识别,该方法虽然能够识别出数字的内容,但是识别准确率低,误识别率高,有可能将数字识别成其他的字符,在稳定性上无法进行保证。
发明内容
针对上述问题,本发明的实施例提供了一种数字串语音识别方法,所述方法包含步骤:获取待识别语音;将所述语音输入至数字串语音识别模型进行识别,以得到所述待识别语音对应的数字串文本,其中,构建所述数字串语音识别模型的算法包含卷积神经网络、长短期记忆网络及全连接网络,所述待识别语音进入所述数字串语音识别模型后,先后经由卷积神经网络、长短期记忆网络及全连接网络的计算,得到所述数字串文本。基于本发明实施例所提供的数字串语音识别方法,可基于预先构建并训练完成的数字串语音识别模型对待识别语音进行识别,从而得到对应的数字文本内容,同时通过对数字串语音识别模型的算法构建进行设计,在识别过程中结合了音频数据的局部特征及时间维度特征,可提升识别准确率。
一种身份验证装置,包含输入单元、验证单元和输出单元,其中,所述输出单元向用户展示语音输入要求,所述语音输入要求中包含预设数字串或提示信息;所述输入单元用于接收用户输入的语音信号,并传输至验证单元;所述验证单元对接收到的语音信号进行验证,包含基于上述的数字串语音识别方法,对所述语音信号进行识别,并基于识别出的数字串文本对所述用户身份进行验证,并发送验证结果至所述输出单元;所述输出单元接收所述验证结果,并对其进行显示。
以及,一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的数字串语音识别方法。
在一实施中,构建所述数字串语音识别模型中的所述卷积神经网络结构包含一层卷积网络和一层maxpooling,其中,卷积网络采用5×5的卷积核,maxpooling层采用5×5的Filter结构。
在一实施中,所述卷积神经网络的输入层为所述待识别语音的频谱图特征数据,输出层的数据结构为帧数乘以1024维的矩阵。
在一实施中,所述长短期记忆网络的结构为3层,每层网络包含300个神经元。
在一实施中,所述长短期记忆网络的输入层为所述卷积神经网络的输出结果,输出层为帧数乘以300维的矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010224785.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大数据的数据存储系统及方法
- 下一篇:一种核医学成像系统、装置及成像方法