[发明专利]一种语音识别应用系统的解决敏感词未知性的方法在审
申请号: | 201410386511.1 | 申请日: | 2014-08-07 |
公开(公告)号: | CN104166850A | 公开(公告)日: | 2014-11-26 |
发明(设计)人: | 徐彬宸 | 申请(专利权)人: | 和汇投资集团股份有限公司;徐彬宸 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 上海三方专利事务所 31127 | 代理人: | 吴干权;李美立 |
地址: | 201401 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 应用 系统 解决 敏感 知性 方法 | ||
1.一种语音识别应用系统的解决敏感词未知性的方法,其特征在于应用程序给操作系统设置敏感词表,语音识别模块将敏感词表引入识别算法,降低了每帧语音识别所需要的时间资源和空间资源,敏感词表是以音素方式表达的敏感词全体集合的一个子集,有了这个子集,就可以降低语音识别算法所需的时间资源和空间资源。
2.如权利要求1所述的一种语音识别应用系统的解决敏感词未知性的方法,其特征在于具体算法处理如下,将敏感词表引入隐马尔科夫声学模型Viterbi算法,大幅降低算法的时间资源和空间资源:
Viterbi算法的原形:
a)初始化
δ1(i)=πibi(o1), 1≤i≤N
b)递归
c)终结
d)求S序列
隐马尔科夫声学模型中一个音素就是一个三至五状态,其中S为隐藏状态集合,S={q},N是状态数目,M为敏感词表Q的状态数,O为观察状态集合,O={o},A为隐藏状态间的转移概率矩阵,A={a},B为输出矩阵,即隐藏状态到输出状态的概率,B={b},PI为初始概率分布,隐藏状态的初始概率分布,PI={π},A,B,PI称为隐马尔科夫的参数,用λ表示,P*是在时刻T输出状态oT的最大概率,是在时刻T最大概率输出状态oT的隐藏状态,δt(i)是t时刻到达状态i的所有序列概率中最大的概率,是在t-1时刻系统必须处于的状态,该状态导致了系统在t时刻到达状态i在所有属于敏感词表序列中是最大概率的;
在使用敏感词表Q之后,五元组{S,O,A,B,PI}没有改变,但敏感词表Q含有的状态集合是S的子集,原始隐含状态集S的状态数为N,敏感词表Q的状态数为M,相应的,改变下列两个函数定义:δt(i)是t时刻到达状态i的所有属于敏感词表子集序列概率中最大的概率,是在t-1时刻系统必须处于的状态,δt(i)是t时刻到达状态i的所有属于敏感词表序列概率中最大的概率,
在t-1时刻系统必须处于的状态,该状态导致了系统在t时刻到达状态i在所有属于敏感词表序列中是最大概率的;
经证明,引入敏感词表之后Viterbi算法下列公式仍然成立,而参数相应的演变为:
a)初始化
δ1(i)=πibi(o1), 1≤i≤M
b)递归
c)终结
d)求S序列
值得注意的是,P*的阈值必须仍然以原始模型为准,
可以看出,引入敏感词表之后算法的参数由N变为M,由于M远远小于N,可见新的算法所需时间和空间会大幅缩小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于和汇投资集团股份有限公司;徐彬宸,未经和汇投资集团股份有限公司;徐彬宸许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410386511.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于写RFID应答器的系统
- 下一篇:芯片通讯的加密方法及激光条码扫描平台