[发明专利]语音识别方法和系统有效

申请号：	201410714386.2	申请日：	2014-11-28
公开（公告）号：	CN104409075B	公开（公告）日：	2018-09-04
发明（设计）人：	付春元	申请（专利权）人：	深圳创维-RGB电子有限公司
主分类号：	G10L15/26	分类号：	G10L15/26
代理公司：	深圳市世纪恒程知识产权代理事务所 44287	代理人：	胡海国
地址：	518057 广东省深圳市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	唇语识别语音识别准确度图像采集语音信号图像图像采集装置语音识别结果语音识别系统语音信号识别采集装置控制图像唇部采集
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种语音识别方法，在接收到语音信号时，控制图像采集装置进行图像采集，并在所述语音信号结束时，控制所述图像采集装置停止图像采集；对接收到的语音信号进行识别，以得到语音信号识别结果；对采集到的图像中包含唇部的图像进行唇语识别，以得到唇语识别结果；计算所述语音信号识别结果和唇语识别结果的准确度，将准确度较高的识别结果作为当前的语音识别结果。本发明还公开了一种语音识别系统。本发明提高了语音识别的准确性。

技术领域

本发明涉及语音控制领域，尤其涉及语音识别方法和系统。

背景技术

随着语音交互的飞速发展，通过语音的方式控制终端(如电视以及空调器等)，或者通过语音的方式进行数据输入已成为应用非常广泛的方式。目前，语音交互仍存在诸多问题，如语音识别不准确，易受环境影响较大，例如周围有人声嘈杂或者有背景音乐的话，语音采集装置采集到的语音信号包括人发出的语音信号以及周围的噪音信号，使得终端无法准确识别接受到的语音信号，导致语音识别不够准确。

发明内容

本发明的主要目的在于提出一种语音识别方法和系统，旨在解决语音识别不够准确的技术问题。

为实现上述目的，本发明提供的一种语音识别方法，所述语音识别方法包括以下步骤：

在接收到语音信号时，控制图像采集装置进行图像采集，并在所述语音信号结束时，控制所述图像采集装置停止图像采集；

对接收到的语音信号进行识别，以得到语音信号识别结果；

对采集到的图像中包含唇部的图像进行唇语识别，以得到唇语识别结果；

计算所述语音信号识别结果和唇语识别结果的准确度，将准确度较高的识别结果作为当前的语音识别结果。

优选地，所述对采集到的图像中包含唇部的图像进行唇语识别，以得到唇语识别结果的步骤包括：

确定采集到的图像中包含唇部的图像，将所述包含唇部的图像作为有效图像，并确定所述有效图像中唇部的位置；

根据每一帧所述有效图像的唇形以及上一帧所述有效图像的唇形确定用户输出的字符；

基于每一帧所述有效图像对应的字符组成唇语识别结果。

优选地，所述确定采集到的图像中包含唇部的图像，将所述包含唇部的图像作为有效图像，并确定所述有效图像中唇部位置的步骤包括：