[发明专利]一种语音输入方法和装置有效
申请号: | 201810251995.7 | 申请日: | 2018-03-26 |
公开(公告)号: | CN108417208B | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 孙权 | 申请(专利权)人: | 宇龙计算机通信科技(深圳)有限公司 |
主分类号: | G10L15/10 | 分类号: | G10L15/10;G10L17/08 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 吴黎 |
地址: | 518057 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 输入 方法 装置 | ||
本申请公开了语音输入方法和装置,该方法包括:接收原始语音信号;将所述原始语音信号转换为数字语音信号;根据语音分离算法在所述数字语音信号中分离出与预存储的模板语音特征匹配的目标数字语音信号;根据所述目标数字语音信号进行语音输入。采用本发明实施例,能提高对混合有多用户的语音的识别率。
技术领域
本发明涉及语音处理领域,尤其涉及一种语音输入方法和装置。
背景技术
语音输入是一种将用户的语音识别成文本输入到特定的文本框中的技术,语音输入解放了用户的双手,降低了输入文本的难度,随着语音输入的准确率的提升,越来越多的终端设备上支持语音输入功能。在目前的语音输入方案中,在安静的环境下,对单个用户的语音识别率非常高,但是在多个用户同时发出语音时,终端设备根据这种混合了多个用户进行识别时容易发生错误,语音输入的准确率非常低。
发明内容
本发明实施例所要解决的技术问题在于,提供一种语音输入方法和装置,实现了对多个用户的混合语音进行识别,提高语音输入的准确率。
第一方面,本申请提供了一种唤醒性能的控制方法,包括:终端设备接收原始语音信号;终端设备将原始语音信号转换为数字语音信号;终端设备根据语音分离算法在数字语音信号中分离出有预存储的模板语音特征匹配的目标数字语音信号;终端设备根据目标数字语音信号进行语音输入。
其中,预存储的模板语音特征和登录该终端设备的账号关联,登录终端设备的方式包括但不限于密码验证、指纹验证或人脸验证等。模板语音特征可通过音色、响度和音域中的至少一种来描述,模板语音特征包括至少一个子语音特征,例如模板语音特征。
在一种可能的设计中,还包括:
终端设备在进行通话时,例如:主叫或被叫时,终端设备获取用户在通话过程中的通话语音信号;终端设备提取通话语音信号的语音特征;根据语音特征更新预存储的模板语音特征。例如,将提取到的语音特征加入到模板语音特征中。
在一种可能的设计中,根据语音分离算法从数字语音信号中分离出与预存储的语音模板匹配的目标数字语音信号包括:
根据语音分离算法从数字语音信号中分离出至少一个数字语音片段;其中,不同的数字语音片段对应不同的用户身份;
确定每个数字语音片段的语音特征;
计算每个数字语音片段的语音特征和预存储的模板语音特征之间的相似度值,将相似度值最大的数字语音片段作为目标数字语音信号。
在一种可能的设计中,将所述原始语言信号转换为数字语音信号之前,还包括:
根据预设的频率范围对原始语音信号进行滤波处理。
在一种可能的设计中,所述预存储的模板语音特征包括:音色、响度和音域中的至少一种。
第二方面,本申请提供了一种语音输入装置,该控制装置具有实现上述方法中终端设备行为的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
接收模块,用于接收原始语音信号;
转换模块,用于将所述原始语音信号转换为数字语音信号;
匹配模块,用于根据语音分离算法在所述数字语音信号中分离出与预存储的模板语音特征匹配的目标数字语音信号;
控制模块,用于根据所述目标数字语音信号进行语音输入。
在一种可能的设计中,语音输入装置还包括:
获取模块,用于在进行通话时,获取用户在通话过程中的通话语音信号;
提取模块,用于提取所述通话语音信号的语音特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宇龙计算机通信科技(深圳)有限公司,未经宇龙计算机通信科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810251995.7/2.html,转载请声明来源钻瓜专利网。