[发明专利]一种语音识别方法及装置在审

申请号：	201910065077.X	申请日：	2019-01-23
公开（公告）号：	CN109767766A	公开（公告）日：	2019-05-17
发明（设计）人：	张利红	申请（专利权）人：	海信集团有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/26;G10L17/22;G10L21/0216
代理公司：	北京中博世达专利商标代理有限公司 11274	代理人：	申健
地址：	266071 山***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	声源语音识别叠加目标声源电视机语音识别装置传声器阵列电视机识别用户语音语音控制预设算法远距离外设采集发送
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音识别方法，应用于语音识别装置，所述语音识别装置包括：传声器阵列，其特征在于，所述方法包括：

通过所述传声器阵列采集第一声源；

采用预设算法，从所述第一声源中分离出目标声源；

接收与所述语音识别装置连接的外设发送的第二声源；

对所述目标声源和所述第二声源进行叠加，得到叠加后的声源；

识别所述叠加后的声源，并根据识别结果执行相应的操作。

2.根据权利要求1所述的语音识别方法，其特征在于，所述识别所述叠加后的声源，并根据识别结果执行相应的操作，包括：

采用声音模型识别所述叠加后的声源，如果结果与预存的唤醒词相同，则启动人机交互功能；

去除所述语音识别装置的声音。

3.根据权利要求1或2所述的语音识别方法，其特征在于，所述对所述目标声源和所述第二声源进行叠加，包括：

采用快拍数方法，对所述目标声源和所述第二声源进行相关性计算，得到延时时间；

以所述目标声源的时间为基准，根据所述延时时间对所述第二声源进行延时处理；

根据所述目标声源和所述第二声源分别对应的权重，对所述目标声源和延时后的所述第二声源进行叠加。

4.根据权利要求1所述的语音识别方法，其特征在于，所述第二声源为所述外设采集的单一方向声源。

5.一种语音识别装置，其特征在于，所述语音识别装置包括：传声器阵列、采集单元、分离单元、接收单元、叠加单元和处理单元；

所述采集单元，用于通过所述传声器阵列采集第一声源；

所述分离单元，用于采用预设算法，从所述第一声源中分离出目标声源；

所述接收单元，用于接收与所述语音识别装置连接的外设发送的第二声源；

所述叠加单元，用于对所述目标声源和所述第二声源进行叠加，得到叠加后的声源；

所述处理单元，用于识别所述叠加后的声源，并根据识别结果执行相应的操作。

6.根据权利要求5所述的语音识别装置，其特征在于，所述处理单元，具体用于：

采用声音模型识别所述叠加后的声源，如果结果与预存的唤醒词相同，则启动人机交互功能；

去除所述语音识别装置的声音。

7.根据权利要求5或6所述的语音识别装置，其特征在于，所述叠加单元，具体用于：

采用快拍数方法，对所述目标声源和所述第二声源进行相关性计算，得到延时时间；

以所述目标声源的时间为基准，根据所述延时时间对所述第二声源进行延时处理；

根据所述目标声源和所述第二声源分别对应的权重，对所述目标声源和延时后的所述第二声源进行叠加。

8.根据权利要求5所述的语音识别装置，其特征在于，所述第二声源为所述外设采集的单一方向声源。

9.一种语音识别装置，其特征在于，所述语音识别装置包括：处理器、存储器、通信接口和通信总线；

所述处理器与所述存储器、所述通信接口通过所述通信总线连接，所述存储器用于存储计算机执行指令，当所述语音识别装置运行时，所述处理器执行所述存储器存储的所述计算机执行指令，以使所述语音识别装置执行如权利要求1-4中任一项所述的语音识别方法。

10.一种计算机存储介质，其特征在于，所述计算机存储介质包括计算机执行指令，当所述计算机执行指令在语音识别装置上运行时，使得所述语音识别装置执行如权利要求1-4中任一项所述的语音识别方法。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于海信集团有限公司，未经海信集团有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910065077.X/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载