[发明专利]语音识别词典制作支持系统、语音识别词典制作支持方法以及语音识别词典制作支持用程序有效
申请号: | 200780006299.X | 申请日: | 2007-02-02 |
公开(公告)号: | CN101432801A | 公开(公告)日: | 2009-05-13 |
发明(设计)人: | 越仲孝文 | 申请(专利权)人: | 日本电气株式会社 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/18 |
代理公司: | 中科专利商标代理有限责任公司 | 代理人: | 李香兰 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 词典 制作 支持系统 支持 方法 以及 程序 | ||
技术领域
本发明涉及语音识别词典制作支持系统、语音识别词典制作支持方法及语音识别词典制作支持用程序,特别地,涉及用于制作存储语音识别处理的构成要素即词汇的语音识别词典、和对字词的排列进行规则化后的语言模型的语音识别词典制作支持系统、语音识别词典制作支持方法以及语音识别词典制作支持用程序。
背景技术
下面对现有技术的语音识别词典制作支持系统的概要进行说明。如图6所示,由文本解析机构201、出现频率计数机构202、更新机构203、背景词典存储机构204、识别词典存储机构205、及语言模型存储机构206构成。
具有这种结构的现有技术的语音识别词典制作支持系统按照如下方式工作。
即,文本解析机构201从外部接收包含语音识别对象词汇的文本数据,利用存储于背景词典存储机构204中的单词词典进行语素(morpheme)解析处理,从而,将文本数据分割成一个一个的单词的系列,赋予其读音文字列,另外根据需要而赋予其词类标签,将其结果送至出现频率计数机构202中。出现频率计数机构202从文本解析机构201接收单词系列,针对各单词对出现频率进行计数,将结果送至更新机构203。更新机构203根据由出现频率计数机构202接收的单词出现频率,计算出各单词的出现概率,与存储于该语言模型存储机构206中的单词的出现概率进行对照,修正存储于后者即语言模型存储机构206中的出现概率,以便接近由前者即文本数据计算出的出现概率。另外,在出现于文本数据中的单词中,针对具有一定以上的出现概率值的单词,确认其是否被登录在识别词典存储机 构205中存储的识别词典中,未登录时认定该单词为未知语,将该单词和出现概率分别登录于识别词典存储机构205和语言模型存储机构206中。
另外,在上述出现频率计数机构202中,除了单词的出现频率之外,通常以连续的2个单词或3个单词的出现次数为单位进行计数。另外,在文本解析机构201的语素解析处理中,为了与错误进行单词的分割和给予错误的读音的情况相对应,也在更新机构203等中设置修正单词边界、人工输入读音的界面(参照后述专利文献1等)。
现有技术语音识别词典制作支持系统的另外一个例子在专利文献1中记载。图7是更新专利文献1的语音识别词典制作支持系统后的图,以便能够与图6对比,由文字列比较机构301、未知语提取机构302、更新机构303、识别词典存储机构305、和语言模型存储机构306构成,突出特征在于,不是利用统计手段检测未知语,而是利用修正误识别后的结果。
具有这种结构的现有技术的语音识别词典制作支持系统按照如下方式工作。
即,文字列比较机构301从外部接收利用未图示的语音识别机构对识别对象语音进行识别后的结果即识别结果文本数据、和对含于该识别结果文本数据中的识别错误以人工进行修正后的误识别修正完毕文本数据,按每一个产生差别的地方,即每一个产生识别错误的地方,以包含识别错误的形式提取单词或者单词列,并送至未知语提取机构302,其中,上述语音识别机构包括存储于识别词典存储机构305中的识别词典、和存储于语言模型存储机构306中的语言模型作为构成要素。未知语提取机构302按从文字列比较机构301接收到的每一个单词或单词列,确认该单词或单词列是否登录在存储于识别词典存储机构305中的识别词典中,未登录时,将该单词或单词列作为新单词登录于识别词典存储机构305中。进一步地,将登录后的新单词和规定的出现概率也登录于语言模型存储机构306中。
另外,在专利文献2~4中,记载了其他的对语音识别词典的未知语的提取/登录方法。在专利文献2中公开了一种未知语登录装置,能够对含未知语的文书文件,进行语素解析等来提取单词,将语音识别词典中不存在的单词在参照背景词典赋予读音和词类后进行登录的未知语登录装置。另外,在专利文献3、4中公开有具有上述未知语的词类和发音的推断功 能并自动登录未知语的未知语登录装置。
另外,在专利文献5中,公开了一种对由互联网站点所广泛收集的网页的单词的出现频率进行计数,并对单词语音识别词典中的同一读音的单词中的选择顺序进行更新的方法。
另外,在专利文献6中,公开了一种声音模型管理服务器和语言模型管理服务器,对于语音识别装置,发送在与输入语音进行对照中使用的语音的模型(声音模型和语言模型),具有定期更新声音模型和语言模型的功能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电气株式会社,未经日本电气株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780006299.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电流互感器用磁芯、电流互感器和瓦特计
- 下一篇:显示装置