[发明专利]提供低声语音的数字助理在审
申请号: | 201680086586.5 | 申请日: | 2016-10-27 |
公开(公告)号: | CN109313898A | 公开(公告)日: | 2019-02-05 |
发明(设计)人: | T·J·瑞提欧;M·J·亨特;H·B·理查兹;M·奇塔昆塔 | 申请(专利权)人: | 苹果公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L13/033;G10L25/18;G10L13/08;G10L25/24 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 吴信刚 |
地址: | 美国加*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音响应 语音 数字助理 用户接收 检测 | ||
1.一种用于操作数字助理的方法,包括:
在具有存储器和一个或多个处理器的用户设备处:
接收来自用户的语音输入;
基于所述语音输入确定将提供低声语音响应;
在确定将提供低声语音响应时,生成所述低声语音响应;以及
将所述低声语音响应提供给所述用户。
2.根据权利要求1所述的方法,其中所述语音输入包括信息请求。
3.根据权利要求2所述的方法,其中所述低声语音响应包括对所述信息请求的响应。
4.根据权利要求1所述的方法,其中所述语音输入包括执行任务的请求。
5.根据权利要求4所述的方法,其中所述低声语音响应包括与执行所述任务相关联的响应。
6.根据权利要求1所述的方法,其中确定将提供所述低声语音响应包括以下中的至少一者:
确定所述语音输入是否包括低声语音输入;以及
确定上下文数据是否指示所述低声语音响应是预期的。
7.根据权利要求6所述的方法,其中所述低声语音输入与具有一个或多个第一频谱特征的第一频谱相关联,所述第一频谱特征与低声语音相关联。
8.根据权利要求7所述的方法,其中所述一个或多个第一频谱特征包括:
第一振幅,其中在阈值频率以下所述第一振幅小于第二振幅,所述第二振幅与所述非低声语音相关联。
9.根据权利要求7所述的方法,其中所述一个或多个第一频谱特征包括第一能量,其中在所述阈值频率以下所述第一能量小于第二能量,所述第二能量与所述非低声语音相关联。
10.根据权利要求7所述的方法,其中所述一个或多个第一频谱特征包括第一音量,其中所述第一音量比第二音量小阈值音量百分比,所述第二音量与所述非低声语音相关联。
11.根据权利要求7所述的方法,其中所述一个或多个第一频谱特征包括所述第一频谱的第一斜率,其中所述第一频谱的所述第一斜率相对于所述第二频谱的第二斜率偏移阈值斜率百分比,所述第二频谱的所述第二斜率与所述非低声语音相关联。
12.根据权利要求7所述的方法,其中确定所述语音输入是否包括低声语音输入包括:
确定所述语音输入是否包括使用所述语音输入的一个或多个特征的低声语音输入,其中所述一个或多个特征表示与所述语音输入的频谱相关联的一个或多个频谱特征。
13.根据权利要求12所述的方法,其中确定所述语音输入是否包括使用所述一个或多个特征的低声语音输入包括:
获取所述语音输入的所述频谱;
确定与所述语音输入的所述频谱相关联的所述一个或多个频谱特征;以及
基于与所述语音输入的所述频谱相关联的所述一个或多个频谱特征确定第一特征和第二特征。
14.根据权利要求13所述的方法,
其中所述第一特征是表示与所述语音输入的所述频谱相关联的能量或振幅的第一梅尔频率倒谱系数(MFCC0);并且
其中所述第二特征是表示与所述语音输入的所述频谱相关联的所述斜率的第二梅尔频率倒谱系数(MFCC1)。
15.根据权利要求13所述的方法,还包括:
获取基于所述第一特征到所述第二特征的低声分数;以及
确定所述低声分数是否满足分数阈值。
16.根据权利要求15所述的方法,其中所述分数阈值可根据所述用户讲话的所述方式进行调整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苹果公司,未经苹果公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680086586.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息处理装置与信息处理方法
- 下一篇:应答装置及应答装置的控制方法、控制程序