[发明专利]用于语音识别的方法及装置有效

申请号：	201610516126.3	申请日：	2016-07-01
公开（公告）号：	CN106128451B	公开（公告）日：	2019-12-10
发明（设计）人：	牛建伟;潘复平;陈本东;杨德刚;都大龙	申请（专利权）人：	北京地平线机器人技术研发有限公司
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/26
代理公司：	11497 北京市正见永申律师事务所	代理人：	黄小临;王怀章
地址：	100085 北京市海淀区上地信息路1号(北京实创高***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本申请公开了一种用于语音识别的方法及装置，其中用于语音识别的方法包括：采集语音信息和空间图像信息；根据所述空间图像信息获取空间信息；根据所述语音信息获取声学特征信息；根据所述空间信息消除声学特征信息中的混响信息；以及根据消除混响后的声学特征信息进行语音识别。根据本申请实施例提供的技术方案，通过环境的空间信息的引入，能够获取环境的三维几何信息和表面材质信息来确定混响时间，获得更好的去混响，去除噪声效果，提高信噪比。
搜索关键词：	用于语音识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种用于语音识别的方法，其特征在于，所述方法包括：/n采集语音信息和利用摄像头采集空间图像信息；/n根据所述空间图像信息获取空间信息；/n根据所述语音信息获取声学特征信息；/n根据所述空间信息计算混响时间，所述空间信息包括所述空间的三维几何信息和空间内物体的表面材质信息；/n通过用于所述混响时间的混响时间模型来消除声学特征信息中的混响信息，所述混响时间模型是通过根据所述混响时间对预先学习的针对多个不同混响时间的多个声学模型进行插值而得到的；以及/n根据消除混响后的声学特征信息进行语音识别。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京地平线机器人技术研发有限公司，未经北京地平线机器人技术研发有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610516126.3/，转载请声明来源钻瓜专利网。

上一篇：基于物联网远程控制的智能锁
下一篇：一种实时监控oracle单块读延迟的方法及装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于语音识别的方法及装置有效

专利文献下载