[发明专利]一种智能语音识别方法有效

申请号：	201810224944.5	申请日：	2018-03-19
公开（公告）号：	CN108447491B	公开（公告）日：	2021-08-10
发明（设计）人：	李仁超	申请（专利权）人：	成都信达智胜科技有限公司
主分类号：	G10L17/08	分类号：	G10L17/08;G10L25/21;G10L25/24;G10L25/87;G06Q20/20;H04L9/32
代理公司：	北京天奇智新知识产权代理有限公司 11340	代理人：	杨春
地址：	610000 四川省成都***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种智能语音识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种智能语音识别方法，该方法包括：步骤1：将短时功率和ZCR作特征区分静音和语音，进行端点检测；步骤2：将端点检测后的语音信号分割为多个等长帧；步骤3：通过音频功率的动态变化得到语音信号特征；步骤4：基于语音信号特征的比较结果进行智能POS机的用户身份认证。本发明提出了一种智能语音识别方法，实现了智能POS机终端身份认证数据本地存储、比对和运算，不需要配置硬件密码设备，也无需上传至支付平台，更具安全性。

技术领域

本发明涉及语音识别，特别涉及一种智能语音识别方法。

背景技术

目前销售终端的网络安全特别是智能POS机的安全性令人瞩目，通过智能POS机进行信息传递的安全问题日益受到人们的重视。在当前的智能POS机应用中，都是采用用户名、口令的用户认证，并且对智能POS机用户下发数字证书，并利用硬件密码终端私钥不可导出性，加强用户的身份安全。但任何形态的硬件密码设备都需在智能POS机外接实体设备，更降低了方案的易用性，增加了用户的操作复杂度。对于现有技术的指纹识别，识别信息需要传输，安全性受到挑战。如果支付平台存储的特征库发生损失，则无法进行身份认证。

发明内容

为解决上述现有技术所存在的问题，本发明提出了一种智能语音识别方法，包括：

步骤1：将短时功率和ZCR作特征区分静音和语音，进行端点检测；

步骤2：将端点检测后的语音信号分割为多个等长帧；

步骤3：通过音频功率的动态变化得到语音信号特征；

步骤4：基于语音信号特征的比较结果进行智能POS机的用户身份认证。

优选地，所述端点检测进一步包括：

检测前，先为短时功率和ZCR确定门限，然后连续计算短时功率及ZCR，调整门限，通过状态分析以判断静音段是否结束。

优选地，在端点检测中，将频带划分成4段，按照下式计算子带的功率比率SE：

其中：U_i和L_i分别表示子带i的上限频率和下限频率，i＝1，2，3，4；X(ω)表示信号在频率ω处的幅值；

如果某帧信号的功率ZCR低于门限，且4段子带的SE近似相等，则判断是静音段。

优选地，所述步骤2进一步包括：