[发明专利]一种语音识别方法及装置在审
申请号: | 201910065077.X | 申请日: | 2019-01-23 |
公开(公告)号: | CN109767766A | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 张利红 | 申请(专利权)人: | 海信集团有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L17/22;G10L21/0216 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 266071 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声源 语音识别 叠加 目标声源 电视机 语音识别装置 传声器阵列 电视机识别 用户语音 语音控制 预设算法 远距离 外设 采集 发送 | ||
1.一种语音识别方法,应用于语音识别装置,所述语音识别装置包括:传声器阵列,其特征在于,所述方法包括:
通过所述传声器阵列采集第一声源;
采用预设算法,从所述第一声源中分离出目标声源;
接收与所述语音识别装置连接的外设发送的第二声源;
对所述目标声源和所述第二声源进行叠加,得到叠加后的声源;
识别所述叠加后的声源,并根据识别结果执行相应的操作。
2.根据权利要求1所述的语音识别方法,其特征在于,所述识别所述叠加后的声源,并根据识别结果执行相应的操作,包括:
采用声音模型识别所述叠加后的声源,如果结果与预存的唤醒词相同,则启动人机交互功能;
去除所述语音识别装置的声音。
3.根据权利要求1或2所述的语音识别方法,其特征在于,所述对所述目标声源和所述第二声源进行叠加,包括:
采用快拍数方法,对所述目标声源和所述第二声源进行相关性计算,得到延时时间;
以所述目标声源的时间为基准,根据所述延时时间对所述第二声源进行延时处理;
根据所述目标声源和所述第二声源分别对应的权重,对所述目标声源和延时后的所述第二声源进行叠加。
4.根据权利要求1所述的语音识别方法,其特征在于,所述第二声源为所述外设采集的单一方向声源。
5.一种语音识别装置,其特征在于,所述语音识别装置包括:传声器阵列、采集单元、分离单元、接收单元、叠加单元和处理单元;
所述采集单元,用于通过所述传声器阵列采集第一声源;
所述分离单元,用于采用预设算法,从所述第一声源中分离出目标声源;
所述接收单元,用于接收与所述语音识别装置连接的外设发送的第二声源;
所述叠加单元,用于对所述目标声源和所述第二声源进行叠加,得到叠加后的声源;
所述处理单元,用于识别所述叠加后的声源,并根据识别结果执行相应的操作。
6.根据权利要求5所述的语音识别装置,其特征在于,所述处理单元,具体用于:
采用声音模型识别所述叠加后的声源,如果结果与预存的唤醒词相同,则启动人机交互功能;
去除所述语音识别装置的声音。
7.根据权利要求5或6所述的语音识别装置,其特征在于,所述叠加单元,具体用于:
采用快拍数方法,对所述目标声源和所述第二声源进行相关性计算,得到延时时间;
以所述目标声源的时间为基准,根据所述延时时间对所述第二声源进行延时处理;
根据所述目标声源和所述第二声源分别对应的权重,对所述目标声源和延时后的所述第二声源进行叠加。
8.根据权利要求5所述的语音识别装置,其特征在于,所述第二声源为所述外设采集的单一方向声源。
9.一种语音识别装置,其特征在于,所述语音识别装置包括:处理器、存储器、通信接口和通信总线;
所述处理器与所述存储器、所述通信接口通过所述通信总线连接,所述存储器用于存储计算机执行指令,当所述语音识别装置运行时,所述处理器执行所述存储器存储的所述计算机执行指令,以使所述语音识别装置执行如权利要求1-4中任一项所述的语音识别方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质包括计算机执行指令,当所述计算机执行指令在语音识别装置上运行时,使得所述语音识别装置执行如权利要求1-4中任一项所述的语音识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信集团有限公司,未经海信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910065077.X/1.html,转载请声明来源钻瓜专利网。