[发明专利]一种语音识别应用系统的解决敏感词未知性的方法在审
申请号: | 201410386511.1 | 申请日: | 2014-08-07 |
公开(公告)号: | CN104166850A | 公开(公告)日: | 2014-11-26 |
发明(设计)人: | 徐彬宸 | 申请(专利权)人: | 和汇投资集团股份有限公司;徐彬宸 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 上海三方专利事务所 31127 | 代理人: | 吴干权;李美立 |
地址: | 201401 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 应用 系统 解决 敏感 知性 方法 | ||
[技术领域]
本发明涉及智能信息处理技术领域,具体来说是一种语音识别应用系统的解决敏感词未知性的方法。
[背景技术]
当代的各种语音识别技术方法大体相似,通常分为前端处理、声学模式训练、模式匹配(解码器)。前端处理,最常见的就是做端点检测(检测能量,找到语音的起始点)和语音增强(去噪,增加信噪比)。解码器是语音识别系统的核心之一,其任务是对输入的信号,根据声学、语言模型及词典,寻找能够以最大概率输出该信号的词串。语音识别系统的模型通常由声学模型和语言模型两部分组成,分别对应于语音到音节概率的计算和音节到字概率的计算。
语音识别技术近20年以来得到了飞快的发展,市场上见到的语音识别系统中识别率和拒识率都有不错的表现。但是都有着以下两个缺陷:
1)实时识别、敏感词未知性、时间空间资源三者难以兼顾
无论是现代史上的各种语音识别技术、还是当代以隐马尔科夫模型为主流的各种语音识别技术,其基本原理都有一个特性,资源都会“随敏感词库增大而几何增长”:随着敏感词数量的上升,语音识别系统消耗的空间资源和时间资源将成几何级数上升。当要求的敏感词数量和系统给予的资源无法匹配时,只好牺牲掉实时识别、或者降低识别准确率等特性。
市场上的语音识别系统为了解决这个矛盾,总是以某个局部特性的牺牲为代价,比如:通过限制敏感词的数量如苹果的Siri、中兴的驾驶助手等软件产品,或者通过增大系统资源做语音识别如云计算、云识别,再或是变实时识别为非实时识别。
当代主流语音识别技术为通常帧长是25ms,而帧移是10ms,如果语音识别处理程序在10ms内不能完成一帧数据的处理,将积累到下一帧去处理,消耗下一帧的时间资源和空间资源,最终积累到整体系统资源的枯竭,从而不能完成实时识别。所以,要做到实时识别,就要让语音识别处理程序对一帧的数据处理时间控制在帧移时间以内。
2)不同的应用程序各自为政,语音识别模块的共享性差。
当代的语音识别技术,通常集成在某个应用程序内部,由语音识别、语义识别两个子模块组成。市场上已见到的语音识别系统通常过于追求语义识别:语音信号经过语音识别之后的结果,再经语义识别转化成文字。忽略了将语音识别的结果直接映射到应用程序的输入节点上去,所谓输入节点,就是应用程序人机交互的接口点,比如菜单里的操作项、比如按钮,等等。而且各个应用程序各自开发一套语音识别子系统,没有共享性。不同应用程序无法知道对方的输入节点,尤其是详细的输入节点列表,所以很难做到真正的共享语音识别模块。如果要使得一个语音识别模块能够很好的不耗时间空间资源的被所有应用程序共享,需要将语音识别模块更好的和操作系统、硬件等资源捏合。
[发明内容]
本发明通过应用程序给操作系统设置敏感词表,语音识别模块将敏感词表引入识别算法,降低了每帧语音识别所需要的时间资源和空间资源;应用程序根据人机交互的进展和应用场景的变更,不断更新敏感词表,使得人们感觉敏感词数量巨大、就像有无穷的敏感词,保持了良好的人机交互体验,从而做到兼顾“实时识别”和“敏感词未知性、数量巨大”和“时间空间资源有限性”;语音识别算法的结果通过操作系统改动后的互动机制通知相应的应用程序进程,从而使得所有应用程序都能够方便地、不消耗时间资源的共享和使用语音识别功能模块;提供一种语音识别系统的解决敏感词未知性的方法。
为了实现上述目的,设计一种语音识别应用系统的解决敏感词未知性的方法,应用程序给操作系统设置敏感词表,语音识别模块将敏感词表引入识别算法,降低了每帧语音识别所需要的时间资源和空间资源,敏感词表是以音素方式表达的敏感词全体集合的一个子集,有了这个子集,就可以降低语音识别算法所需的时间资源和空间资源。
具体算法处理如下,将敏感词表引入隐马尔科夫声学模型Viterbi算法,大幅降低算法的时间资源和空间资源(并不局限于Viterbi算法,其它识别算法引入敏感词表之后同样可以大幅降低时间资源和空间资源):
Viterbi算法的原形:
a)初始化
δ1(i)=πibi(o1), 1≤i≤N
b)递归
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于和汇投资集团股份有限公司;徐彬宸,未经和汇投资集团股份有限公司;徐彬宸许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410386511.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于写RFID应答器的系统
- 下一篇:芯片通讯的加密方法及激光条码扫描平台