[发明专利]基于声纹识别的语音识别抗干扰方法、装置及存储介质在审
申请号: | 201910267072.5 | 申请日: | 2019-04-03 |
公开(公告)号: | CN110139146A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 周胜杰 | 申请(专利权)人: | 深圳康佳电子科技有限公司 |
主分类号: | H04N21/439 | 分类号: | H04N21/439;H04N21/472;G10L17/22;G10L15/22;G10L15/18 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 王永文;刘文求 |
地址: | 518000 广东省深圳市南山区粤*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 拾音 指令 语音识别 声纹识别 存储介质 声纹特征 有效语音 抗干扰 声纹 声源 维度 解析 语义 无效指令 语义解析 语音交互 预定规则 智能电视 准确率 混杂 过滤 语音 分解 分组 混乱 | ||
本发明公开了基于声纹识别的语音识别抗干扰方法、装置及存储介质,所述方法包括:收集获取拾音数据;对获取的拾音数据进行声纹识别,将所有的声纹特征及对应的拾音数据进行分解,解出按照声纹特征为维度的新的拾音数据;将新的拾音数据按照分组进行语义解析,解析成按照声纹为维度存为声纹语义指令;并过滤不清楚的无效指令;得到有效语音指令;控制按预定规则执行与有效语音指令对应的操作。本发明解决多人同时下发指令环境下,语音拾音同时识别到多组或多个声源造成的指令混乱,多声源混杂指令无法有效的识别及执行的问题;提高了语音识别解析指令的准确率,极大的提升了智能电视语音交互的语音识别的效率及质量,提高了安全性。
技术领域
本发明涉及语音识别技术领域,具体涉及一种基于声纹识别的语音识别抗干扰方法、装置及存储介质。
背景技术
当前智能电视语音识别功能已经成为一种新型的电视交互方式,虽然语音的出现给电视的交互带来了非常大的易用性体验。
但是当前的语音识别在使用的过程中存在一个非常大的缺陷,当语音输入的时候如果同时有很多人都在说话(发送指令),语音会把所有人说话的声音都录制进去(拾音),而语音在进行解析这些录音的时候并不会进行区分(语义解析),所以解析出来的结果就是所有人的说话都夹杂在一起,无法解析出正确的语音指令供电视执行,不方便用户的使用。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足之处,本发明的目的在于提供一种基于声纹识别的语音识别抗干扰方法、装置及存储介质,本发明解决多人同时下发指令环境下,语音拾音同时识别到多组或多个声源造成的指令混乱,多声源混杂指令无法有效的识别及执行的问题;提高了语音识别解析指令的准确率,极大的提升了智能电视语音交互的语音识别的效率及质量,提高了安全性。
为了达到上述目的,本发明采取了以下技术方案:
一种基于声纹识别的语音识别抗干扰方法,其中,包括如下步骤:
A、收集获取拾音数据;
B、对获取的拾音数据进行声纹识别,将所有的声纹特征及对应的拾音数据进行分解,解出按照声纹特征为维度的新的拾音数据;
C、将新的拾音数据按照分组进行语义解析,解析成按照声纹为维度存为声纹语义指令;并过滤不清楚的无效指令;得到有效语音指令;
D、控制按预定规则执行与有效语音指令对应的操作。
所述的基于声纹识别的语音识别抗干扰方法,其中,所述步骤A之前还包括:
S1、预先设置用于获取拾音数据的语音拾音模块;
S2、以设置与语音拾音模块连接的,用于进行声纹识别的声纹识别模块;
S3、以设置与声纹识别模块连接的,用于进行语义解析的解析模块;
以及设置与解析模块连接的,用于过滤不清楚的无效指令的抗干扰分析模块。
所述的基于声纹识别的语音识别抗干扰方法,其中,所述步骤A包括:
A1、通过语音拾音模块收集获取拾音数据。
所述的基于声纹识别的语音识别抗干扰方法,其中,所述步骤B包括:
B1、通过声纹识别模块对获取的拾音数据进行声纹识别,解析出拾音数据的声纹特征,将所有的声纹特征及对应的拾音数据进行分解,分解出按照声纹特征为维度的新的拾音数据。
所述的基于声纹识别的语音识别抗干扰方法,其中,所述步骤C包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳康佳电子科技有限公司,未经深圳康佳电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910267072.5/2.html,转载请声明来源钻瓜专利网。