[发明专利]抑制背景广播的语音指令识别方法与装置无效
申请号: | 201210427406.9 | 申请日: | 2012-10-31 |
公开(公告)号: | CN102915732A | 公开(公告)日: | 2013-02-06 |
发明(设计)人: | 赵威;张忠铭 | 申请(专利权)人: | 黑龙江省电力有限公司信息通信分公司;国家电网公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 张果瑞 |
地址: | 150090 黑龙江省哈尔滨*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 抑制 背景 广播 语音 指令 识别 方法 装置 | ||
技术领域
本发明涉及音频采集领域。
背景技术
目前很多控制中心、家用电器、车载系统都开始使用语音指令识别控制方式,然而有效去除背景声音,单独分离出发令人的语音是很多系统首要解决的难题。目前常见的做法是用一个指向性麦克风指向发令人,另一个麦克风背向发令人采集背景声音,然后将两者进行反相叠加的噪声消除算法抵消掉背景噪音。但是目前绝大多数语音指令的应用场景都有播放人声的扩音播放系统,例如使用外放音箱的视频通话系统、电视播放系统、车载音响广播等。常用的背景降噪方法很难将这种同样是人说话声音的背景广播同发令人的语音指令有效区分开来。
发明内容
为了解决现有的语音指令识别控制方式无法有效去除背景声音,单独分离出发令人的语音的问题,提出了抑制背景广播的语音指令识别方法与装置。
抑制背景广播的语音指令识别方法为,通过音频数据线接收背景广播的音频信息作为参考信号,同时通过麦克风拾取现场混杂有背景广播的语音指令信息作为待处理信号;
根据参考信号将待处理信号进行降噪处理,滤除该待处理信号中的背景广播的音频信息,分离获得发令人的语音指令信息。
实现抑制背景广播的语音指令识别方法的装置,它包括扩音播放系统、音箱、麦克风、反相叠加运算降噪处理器和语音指令识别系统,
所述扩音播放系统的第一音频信号输出端与反相叠加运算降噪处理器的第一音频信号输入端相连,扩音播放系统的第二音频信号输出端与音箱的音频信号输入端相连,麦克风的音频信号输出端与反相叠加运算降噪处理器的第二音频信号输入端相连,反相叠加运算降噪处理器的音频信号输出端与语音指令识别系统的指令信号输入端相连。
本发明通过在环境背景的扩音播放系统电路中直接采集音频电子信号,将采集到的声音信号同现场麦克风采集到的混杂声音信号进行反相叠加或其它降噪方式处理,从而将发令人的语音指令从同样是人声的背景声音环境中分离出来,从而得到纯粹的发令人的说话声音,然后将降噪处理过的声音信号再传送给语音指令识别系统进行辨识,以此极大的提高语音指令识别的准确性。
本发明可以在背景扩音播放环境下有效地分离出现场发令人的语音。例如在视频会议通话环境中,有效地将本地人员说话的声音同对方传送过来的语音分离出来;在电视或广播中播放人员说话的场景时,将现场人员的声音指令同喇叭播放出的人声有效区分出来。即使背景中播放的声音是预先录制的发令人本身的声音,本发明也能有效地区分出发令人在现场实际的说话声音。从而避免了同样是人声的语音背景播放引起语音识别系统的误操作。
附图说明
图1是抑制背景广播的语音指令识别装置的电气元件连接示意图。
具体实施方式
具体实施方式一:抑制背景广播的语音指令识别方法为:通过音频数据线接收背景广播的音频信息作为参考信号,同时通过麦克风拾取现场混杂有背景广播的语音指令信息作为待处理信号;
根据参考信号将待处理信号进行降噪处理,滤除该待处理信号中的背景广播的音频信息,分离获得发令人的语音指令信息。
具体实施方式二:本实施方式与具体实施方式一所述的抑制背景广播的语音指令识别方法的不同点在于,根据参考信号将待处理信号进行降噪处理的过程为:将参考信号和待处理信号进行反向叠加运算,进而抑制待处理信号中的参考信号。
具体实施方式三:实现权利要求1所述的抑制背景广播的语音指令识别方法的装置,它包括扩音播放系统1、音箱2、麦克风3、反相叠加运算降噪处理器4和语音指令识别系统5;
所述扩音播放系统1的第一音频信号输出端与反相叠加运算降噪处理器4的第一音频信号输入端相连,扩音播放系统1的第二音频信号输出端与音箱2的音频信号输入端相连,麦克风3的音频信号输出端与反相叠加运算降噪处理器4的第二音频信号输入端相连,反相叠加运算降噪处理器4的音频信号输出端与语音指令识别系统5的指令信号输入端相连。
具体实施方式四:本实施方式与具体实施方式三所述的抑制背景广播的语音指令识别装置的不同点在于,所述反相叠加运算降噪处理器4将第一音频信号输入端输入的音频信息与第二音频信号输入端输入的音频信息进行反向叠加运算,并将运算获得的音频信息作为输出信号发送至音频信号输出端。
在环境背景的扩音播放系统电路中直接采集音频电子信号,该信号是完全不含发令人声音的纯粹背景声音。将采集到的声音信号同现场麦克风采集到的混杂声音信号进行反相叠加或其它降噪方式处理,从而得到纯粹的发令人的说话声音。然后可以将本发明降噪处理过的声音信号再传送给语音指令识别系统进行辨识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黑龙江省电力有限公司信息通信分公司;国家电网公司,未经黑龙江省电力有限公司信息通信分公司;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210427406.9/2.html,转载请声明来源钻瓜专利网。