[发明专利]分析话语信号在审

申请号：	201880065835.1	申请日：	2018-10-11
公开（公告）号：	CN111201570A	公开（公告）日：	2020-05-26
发明（设计）人：	J·P·莱索	申请（专利权）人：	思睿逻辑国际半导体有限公司
主分类号：	G10L25/93	分类号：	G10L25/93;G10L17/14
代理公司：	北京北翔知识产权代理有限公司 11285	代理人：	关丽丽;郑建晖
地址：	英国***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	分析话语信号
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种分析音频信号的方法，该方法包括：

接收代表话语的音频信号；

提取所述音频信号中分别代表所述话语的第一声学类别和第二声学类别的第一分量和第二分量；

用已注册用户的话语的第一声学类别的模型和第二声学类别的模型来分析所述音频信号的第一分量和第二分量；以及

基于所述分析，获得关于影响所述音频信号的信道和噪声中的至少一个的信息。

2.根据权利要求1所述的方法，其中提取所述音频信号的第一分量和第二分量包括：

标识所述音频信号包含浊音话语的时段；以及

将话语的剩余时段标识为包含清音话语。

3.根据权利要求1或2所述的方法，其中用所述已注册用户的话语的第一声学类别的模型和第二声学类别的模型来分析所述音频信号的第一分量和第二分量包括：

将所述音频信号在多个预定频率处的幅度与所述话语的第一声学类别的模型和第二声学类别的模型中的幅度进行比较。

4.根据任一前述权利要求所述的方法，包括针对信道和/或噪声补偿所接收的音频信号。

5.根据任一前述权利要求所述的方法，包括：

对所接收的音频信号执行说话人标识过程，以形成关于说话人的身份的临时决定；

基于关于所述说话人的身份的临时决定，从多个模型中选择所述已注册用户的话语的第一声学类别的模型和第二声学类别的模型；

针对信道和/或噪声来补偿所接收的音频信号；以及

对经补偿的所接收的音频信号执行第二说话人标识过程，以形成所述说话人的身份的最终结论。

6.根据权利要求5所述的方法，其中针对信道和/或噪声来补偿所接收的音频信号包括：

标识所接收的音频信号中噪声水平超过阈值水平的频谱的至少一部分；以及

在执行所述第二说话人标识过程时，忽略所接收的音频信号的频谱的已标识部分。

7.根据权利要求1至6中的任一项所述的方法，其中所述话语的第一声学类别和第二声学类别包括浊音话语和清音话语。

8.根据权利要求1至6中的任一项所述的方法，其中所述话语的第一声学类别和第二声学类别包括第一音素类别和第二音素类别。

9.根据权利要求1至6中的任一项所述的方法，其中所述话语的第一声学类别和第二声学类别包括第一摩擦音和第二摩擦音。

10.根据权利要求1至6中的任一项所述的方法，其中所述话语的第一声学类别和第二声学类别包括摩擦音和咝擦音。

11.一种用于分析音频信号的系统，该系统包括用于接收音频信号的输入，且被配置用于：

接收代表话语的音频信号；

提取所述音频信号中分别代表所述话语的第一声学类别和第二声学类别的第一分量和第二分量；

用已注册用户的话语的第一声学类别的模型和第二声学类别的模型来分析所述音频信号的第一分量和第二分量；以及

基于所述分析，获得关于影响所述音频信号的信道和噪声中的至少一个的信息。

12.一种包括根据权利要求1至10中的任一项所述的系统的设备。

13.根据权利要求12所述的设备，其中所述设备包括移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、遥控器设备、玩具、机器或家庭自动化控制器或家用电器。

14.一种计算机程序产品，包括计算机可读有形介质，以及用于执行根据权利要求1至10中的任一项所述的方法的指令。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于思睿逻辑国际半导体有限公司，未经思睿逻辑国际半导体有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201880065835.1/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载