[发明专利]基于声纹识别的语音识别抗干扰方法、装置及存储介质在审

申请号：	201910267072.5	申请日：	2019-04-03
公开（公告）号：	CN110139146A	公开（公告）日：	2019-08-16
发明（设计）人：	周胜杰	申请（专利权）人：	深圳康佳电子科技有限公司
主分类号：	H04N21/439	分类号：	H04N21/439;H04N21/472;G10L17/22;G10L15/22;G10L15/18
代理公司：	深圳市君胜知识产权代理事务所(普通合伙) 44268	代理人：	王永文;刘文求
地址：	518000 广东省深圳市南山区粤***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	拾音指令语音识别声纹识别存储介质声纹特征有效语音抗干扰声纹声源维度解析语义无效指令语义解析语音交互预定规则智能电视准确率混杂过滤语音分解分组混乱
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了基于声纹识别的语音识别抗干扰方法、装置及存储介质，所述方法包括：收集获取拾音数据；对获取的拾音数据进行声纹识别，将所有的声纹特征及对应的拾音数据进行分解，解出按照声纹特征为维度的新的拾音数据；将新的拾音数据按照分组进行语义解析，解析成按照声纹为维度存为声纹语义指令；并过滤不清楚的无效指令；得到有效语音指令；控制按预定规则执行与有效语音指令对应的操作。本发明解决多人同时下发指令环境下，语音拾音同时识别到多组或多个声源造成的指令混乱，多声源混杂指令无法有效的识别及执行的问题；提高了语音识别解析指令的准确率，极大的提升了智能电视语音交互的语音识别的效率及质量，提高了安全性。

技术领域

本发明涉及语音识别技术领域，具体涉及一种基于声纹识别的语音识别抗干扰方法、装置及存储介质。

背景技术

当前智能电视语音识别功能已经成为一种新型的电视交互方式，虽然语音的出现给电视的交互带来了非常大的易用性体验。

但是当前的语音识别在使用的过程中存在一个非常大的缺陷，当语音输入的时候如果同时有很多人都在说话（发送指令），语音会把所有人说话的声音都录制进去（拾音），而语音在进行解析这些录音的时候并不会进行区分（语义解析），所以解析出来的结果就是所有人的说话都夹杂在一起，无法解析出正确的语音指令供电视执行，不方便用户的使用。

因此，现有技术还有待于改进和发展。

发明内容

鉴于上述现有技术的不足之处，本发明的目的在于提供一种基于声纹识别的语音识别抗干扰方法、装置及存储介质，本发明解决多人同时下发指令环境下，语音拾音同时识别到多组或多个声源造成的指令混乱，多声源混杂指令无法有效的识别及执行的问题；提高了语音识别解析指令的准确率，极大的提升了智能电视语音交互的语音识别的效率及质量，提高了安全性。

为了达到上述目的，本发明采取了以下技术方案：

一种基于声纹识别的语音识别抗干扰方法，其中，包括如下步骤：

A、收集获取拾音数据；

B、对获取的拾音数据进行声纹识别，将所有的声纹特征及对应的拾音数据进行分解，解出按照声纹特征为维度的新的拾音数据；

C、将新的拾音数据按照分组进行语义解析，解析成按照声纹为维度存为声纹语义指令；并过滤不清楚的无效指令；得到有效语音指令；

D、控制按预定规则执行与有效语音指令对应的操作。

所述的基于声纹识别的语音识别抗干扰方法，其中，所述步骤A之前还包括：

S1、预先设置用于获取拾音数据的语音拾音模块；

S2、以设置与语音拾音模块连接的，用于进行声纹识别的声纹识别模块；

S3、以设置与声纹识别模块连接的，用于进行语义解析的解析模块；

以及设置与解析模块连接的，用于过滤不清楚的无效指令的抗干扰分析模块。

所述的基于声纹识别的语音识别抗干扰方法，其中，所述步骤A包括：