[发明专利]一种语音输入方法和装置有效

申请号：	201810251995.7	申请日：	2018-03-26
公开（公告）号：	CN108417208B	公开（公告）日：	2020-09-11
发明（设计）人：	孙权	申请（专利权）人：	宇龙计算机通信科技（深圳）有限公司
主分类号：	G10L15/10	分类号：	G10L15/10;G10L17/08
代理公司：	北京三聚阳光知识产权代理有限公司 11250	代理人：	吴黎
地址：	518057 广东省***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音输入方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了语音输入方法和装置，该方法包括：接收原始语音信号；将所述原始语音信号转换为数字语音信号；根据语音分离算法在所述数字语音信号中分离出与预存储的模板语音特征匹配的目标数字语音信号；根据所述目标数字语音信号进行语音输入。采用本发明实施例，能提高对混合有多用户的语音的识别率。

技术领域

本发明涉及语音处理领域，尤其涉及一种语音输入方法和装置。

背景技术

语音输入是一种将用户的语音识别成文本输入到特定的文本框中的技术，语音输入解放了用户的双手，降低了输入文本的难度，随着语音输入的准确率的提升，越来越多的终端设备上支持语音输入功能。在目前的语音输入方案中，在安静的环境下，对单个用户的语音识别率非常高，但是在多个用户同时发出语音时，终端设备根据这种混合了多个用户进行识别时容易发生错误，语音输入的准确率非常低。

发明内容

本发明实施例所要解决的技术问题在于，提供一种语音输入方法和装置，实现了对多个用户的混合语音进行识别，提高语音输入的准确率。

第一方面，本申请提供了一种唤醒性能的控制方法，包括：终端设备接收原始语音信号；终端设备将原始语音信号转换为数字语音信号；终端设备根据语音分离算法在数字语音信号中分离出有预存储的模板语音特征匹配的目标数字语音信号；终端设备根据目标数字语音信号进行语音输入。

其中，预存储的模板语音特征和登录该终端设备的账号关联，登录终端设备的方式包括但不限于密码验证、指纹验证或人脸验证等。模板语音特征可通过音色、响度和音域中的至少一种来描述，模板语音特征包括至少一个子语音特征，例如模板语音特征。

在一种可能的设计中，还包括：

终端设备在进行通话时，例如：主叫或被叫时，终端设备获取用户在通话过程中的通话语音信号；终端设备提取通话语音信号的语音特征；根据语音特征更新预存储的模板语音特征。例如，将提取到的语音特征加入到模板语音特征中。

在一种可能的设计中，根据语音分离算法从数字语音信号中分离出与预存储的语音模板匹配的目标数字语音信号包括：

根据语音分离算法从数字语音信号中分离出至少一个数字语音片段；其中，不同的数字语音片段对应不同的用户身份；

确定每个数字语音片段的语音特征；

计算每个数字语音片段的语音特征和预存储的模板语音特征之间的相似度值，将相似度值最大的数字语音片段作为目标数字语音信号。

在一种可能的设计中，将所述原始语言信号转换为数字语音信号之前，还包括：

根据预设的频率范围对原始语音信号进行滤波处理。