[发明专利]语音识别装置及方法、以及半导体集成电路装置有效
申请号: | 201410065495.6 | 申请日: | 2014-02-25 |
公开(公告)号: | CN104008752B | 公开(公告)日: | 2018-08-28 |
发明(设计)人: | 野中勉 | 申请(专利权)人: | 精工爱普生株式会社 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L15/30 |
代理公司: | 北京金信知识产权代理有限公司 11225 | 代理人: | 黄威;苏萌萌 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 装置 方法 以及 半导体 集成电路 | ||
本发明涉及一种语音识别装置及方法、以及半导体集成电路装置,通过使语音识别中选择项信息的更新变容易从而适当限制选择项信息的范围以提高识别率、或者能应对较深的语音识别分级菜单。语音识别用的半导体集成电路装置包括:将表示单词或者语句的文本数据与指令一起接收并根据指令在转换列表中设定文本数据的转换候选设定部;从语音识别数据库中提取与在转换列表中所设定的文本数据表示的单词或者语句的至少一部分相对应的标准模式的标准模式提取部;提取所输入的语音信号的频率成分并生成表示频率成分的分布状态的特征模式的信号处理部;检测根据语音信号的至少一部分而生成的特征模式和标准模式的一致性并输出语音识别结果的一致检测部。
技术领域
本发明涉及一种语音识别装置以及语音识别方法,所述语音识别装置及语音识别方法作为自动贩卖机、家电产品、家用设备、车载装置(导航装置等)、以及移动终端等中的人机界面技术的一环,对语音进行识别,并实施与该识别结果相对应的响应及处理。并且,本发明涉及一种在这种语音识别装置中所使用的半导体集成电路装置等。
背景技术
语音识别为一种如下的技术,即,通过对被输入的语音信号进行分析,并将作为该分析的结果而得出的特征模式、与根据被预先收录的语音信号而存储于语音识别数据库中的标准模式(也称为“模板”)进行对照,从而得到识别结果的技术。但是,在未对对照的范围设置限制的情况下,应当进行比较的特征模式与标准模式的组合将成为庞大的数量,从而为了得到识别结果而需要花费较多的时间,并且由于具有相似的标准模式的单词或者语句的数量也会变多,因此将会呈现出识别率降低的趋势。
作为相关联的现有技术,在专利文献1中公开了一种如下的播放装置,其目的在于,不需要预先的准备或大量的词典,通过语音便能够指定应当播放的乐曲等的内容。该播放装置读取被存储在CD中的TOC(Table Of Contents:目录表)数据内的曲名数据,预先将该曲名数据转换为与语音识别结果相同的格式以作为候选数据而进行保存,并将对语音输入的曲名实施语音识别处理而得到的结果与候选数据进行对照,并且对与匹配性最高的候选数据相对应的乐曲进行播放。其结果为,由于能够通过用户的语音来指定应当播放的乐曲,因此减少了由用户实施的显示确认及按钮操作等。
在专利文献1的播放装置中,语音识别中的选择项被限定于被存储在CD中的乐曲,并且作为文字信息的曲名数据被转换成与语音识别结果相同格式的候选数据。但是,将曲名数据等的文字信息转换为候选数据的处理的负担较大,在如以导航装置为代表的这种实施多种多样的信息处理的装置中,难以与已经在实施的其他信息处理并行地,迅速地实施随着该转换处理而产生的语音识别词典的制作及更新等的操作。因此,将产生语音识别处理延迟的问题。
此外,在专利文献2中公开了一种车载信息处理装置,其目的在于,能够在用于语音识别的语音识别词典的更新过程中实施语音识别。该车载信息处理装置具有:连接单元,其上连接有信息终端,所述信息终端具有信息数据和属性数据,所述属性数据包括对该信息数据进行确定的识别信息;语音识别词典制作单元,其取得信息终端所具有的属性数据,并将该属性数据的一部分转换成语音识别信息,并且将该语音识别信息与识别信息关联起来从而制作出语音识别词典;词典存储单元,其对所制作出的语音识别词典进行存储;语音识别处理单元,其实施语音识别处理,所述语音识别处理为,对所输入的语音进行处理,并从语音识别词典中检测出与对应于该语音的语音识别信息相关联的识别信息;信息数据取得单元,其通过设定所检测出的识别信息,从而根据该识别信息来取得信息终端的信息数据,并且所述车载信息处理装置输出基于所取得的信息数据的信息。
专利文献2的车载信息处理装置具有判断单元,在语音识别词典制作单元制作语音识别词典的过程中,所述判断单元通过被存储于词典存储单元中的语音识别词典来实施语音识别处理,并对通过该语音识别处理所检测出的识别信息与信息终端的识别信息一致还是不一致进行判断,在一致时与不一致时,对在信息数据取得单元中设定的识别信息进行变更,从而使所取得的信息数据成为不同的数据。但是,如果在取得了新的属性数据后,使用被存储于词典存储单元中的更新前的语音识别词典来实施语音识别处理,则也存在无法获得良好的语音识别结果的情况。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于精工爱普生株式会社,未经精工爱普生株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410065495.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:内燃机的控制装置
- 下一篇:一种电动汽车交流充电桩及其使用方法