[发明专利]声学处理单元接口有效
申请号: | 201280070114.2 | 申请日: | 2012-12-18 |
公开(公告)号: | CN104137178B | 公开(公告)日: | 2018-01-19 |
发明(设计)人: | V·纳塔拉詹;S·罗斯内 | 申请(专利权)人: | 赛普拉斯半导体公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/01 |
代理公司: | 北京安信方达知识产权代理有限公司11262 | 代理人: | 陆建萍,郑霞 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声学 处理 单元 接口 | ||
1.一种语音辨识系统,包括:
处理单元,用以将一接收到的音频信号分割成具有各自的帧向量的连续帧;
声学处理单元(APU),包含:
局部非易失性存储器,用以储存多个聚类状态,
记忆缓冲器,耦合到该存储器,其中,该声学处理单元用以将至少一储存于该存储器中的高斯机率分布向量加载至该记忆缓冲器,以及
计分单元,用以同时比较一加载至该记忆缓冲器的高斯机率分布向量的多个维度和一从该处理单元接收的帧向量的各别维度,并输出一距离分数;
聚类状态计分控制单元,其分割与所述接收到的音频信号相关联的时脉频率并将被分割的时脉频率提供至所述计分单元,其中所述计分单元以所述被分割的时脉频率运作且所述被分割的时脉频率大于与所述接收到的音频信号相关联的所述时脉频率;
其中,该声学处理单元使用一第一帧来执行一比较以生成该距离分数而该处理单元使用与一第二帧对应的另一距离分数来执行一搜寻以找到聚类状态分数匹配,该第二帧紧接着先前的该第一帧;以及
数据总线,用以耦合该处理单元和该声学处理单元。
2.根据权利要求1所述的语音辨识系统,其特征在于,该处理单元用以同时运行一搜寻线程和一距离计算线程。
3.根据权利要求2所述的语音辨识系统,其特征在于,该处理单元包括:
应用程式接口API模块,用以接收一来自该距离计算线程的指令并产生一个或多个相对应的指令由该声学处理单元接收。
4.根据权利要求3所述的语音辨识系统,其特征在于,该API模块包括:
通用DCA,用以接收一来自该距离计算线程的指令并输出实现接收到的该指令的指令库中的一个或多个函数。
5.根据权利要求4所述的语音辨识系统,该通用DCA至少指定:
(1)用以储存一声学模型的创建函数,一些在特征向量中的维度,以及一些在该声学模型中作为状态讯息的聚类状态;
(2)集合特征函数,用以储存一对应一接收到的帧识别的特征向量;
(3)计算分数函数,用以指定至少一聚类状态被计分为一帧;
(4)填充分数函数,用以储存聚类状态分数在一缓冲器中;
(5)集合特征矩阵函数,用以储存一特征向量转换矩阵和适应与一特定发声器的比对。
6.根据权利要求5所述的语音辨识系统,其特征在于,该API模块进一步包含一APU库,用以接收来自该通用DCA的参数以及输出与该声学处理单元相容的参数。
7.根据权利要求6所述的语音辨识系统,该APU库至少指定:
(1)集合声学模型函数,用以组成一声学模型来用于聚类状态计分;
(2)加载特征向量函数,用以加载一特征向量至该声学处理单元之中;
(3)分数聚类状态块函数,用以加载一聚类状态列表至该声学处理单元之中;
(4)分数范围函数,用以指定在一范围内的所有聚类状态都有被记分;
(5)读取聚类状态分数函数,用以读取聚类状态分数并储存该聚类状态分数于一目标缓冲器;
(6)检查分数准备状态函数,用以决定聚类状态分数是否准备好从该声学处理单元中被读取;
(7)读取分数长度函数,用以读取该声学处理单元中的一第一状态暂存器以决定一些可用的得分项;
(8)读取状态函数,用以读取该声学处理单元中的一第二状态暂存器以决定一读取操作的状态;
(9)读取组态函数,用以读取该声学处理单元中的一组态暂存器;以及
(10)写入组态函数,用以写入该组态暂存器。
8.根据权利要求6所述的语音辨识系统,其特征在于,该API模块进一步包含:
硬件抽象层(HAL),作为该APU库与该声学处理单元之间的接口。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赛普拉斯半导体公司,未经赛普拉斯半导体公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280070114.2/1.html,转载请声明来源钻瓜专利网。