[发明专利]例外语辞典制作装置、例外语辞典制作方法及其程序、和声音识别装置和声音识别方法无效
申请号: | 200980131687.X | 申请日: | 2009-08-07 |
公开(公告)号: | CN102119412A | 公开(公告)日: | 2011-07-06 |
发明(设计)人: | 小柳津聪;山田真士 | 申请(专利权)人: | 旭化成株式会社 |
主分类号: | G10L15/06 | 分类号: | G10L15/06 |
代理公司: | 上海市华诚律师事务所 31210 | 代理人: | 侯莉 |
地址: | 日本国*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 例外 辞典 制作 装置 制作方法 及其 程序 声音 识别 方法 | ||
技术领域
本发明涉及制作将词汇的文本列变换为发音记号列的变换装置使用的例外语辞典的例外语辞典制作装置、例外语辞典制作方法及其程序,以及涉及采用该例外语辞典进行声音识别的声音识别装置和声音识别方法。
背景技术
在将以文本表示的任意词汇或文章变换为声音输出的声音合成装置,或基于文本记载对登录到声音识别辞典中的识别对象的词汇或文章进行声音识别的声音识别装置中,采用用于将输入文本变换为发音记号列的文本发音记号变换装置。将该装置所进行的将文本记载的词汇变换为发音记号列的处理被称为文本音素变换(text-to-phoneme)或字素音素变换(grapheme-to-phoneme)。作为将识别对象的词汇的文本记载登录到声音识别辞典进行声音识别的声音识别装置的一例,有对登录于手机电话簿中的对方的登录名称进行声音识别并对与该登录名称对应的电话号码打电话的手机,或者与手机的组合使用,读入手机电话簿进行声音拨号的免提(ハンズフリ一)的通话装置。登录于手机电话簿的对方的登录名称仅以文本记载方式输入而没有以发音记号的方式输入的情况下,无法将该登录名称登录到声音识别辞典中。因为,表示登录名称的读法的音素记载等发音记号列作为登录到声音识别辞典的信息是必要的。因此,为了将对方的登录名称的文本记载变换为发音记号列,采用文本发音记号变换装置。如图25所示,基于通过文本发音记号变换装置得到的发音记号列将登录名称作为识别对象词汇登录到声音识别辞典中,因此手机用户通过对发出的登录名称进行声音识别,可不进行复杂的按键操作,即可向对应于登录名称的电话号码进行拨号(参考图26)。
作为将识别对象的单词的文本记载登录到声音识别辞典进行声音识别的声音识别装置的另一实例,有能够与播放保存于内置硬盘或内置半导体存储器的乐曲文件的便携式数字音乐播放装置连接使用的车载音频装置。该车载音频装置具有声音识别功能,将与所连接的别携式数字音乐播放装置中所保存的乐曲文件相关联的曲名或艺术家名字作为声音识别的识别对象词汇。与前面的无需手动操作通话装置的情况相同,由于与便携式数字音乐播放装置中保存的乐曲文件相关联的曲名和艺术家名字仅以文本记载的方式输入而没有以发音记号的方式输入,因此需要文本发音记号变换装置(参考图27、28)。
作为采用以往的文本发音记号变换装置的方法,有基于单词辞典的方法和基于规则的方法。在基于单词辞典的方法中,构成有单词等文本列各自与发音记号列对应的单词辞典。在声音识别装置的文本发音记号变换装置处理中,对作为识别对象词汇的单词等的输入文本列检索单词辞典,输出对应于该输入文本列的发音记号列。在该方法中,为了与具有输入可能性的输入文本列大范围对应,需要增大单词辞典的尺寸,因此具有用于展开单词辞典的存储器要求量增大的问题。
作为解决上述存储器要求量问题的文本发音记号变换装置所采用的方法,有基于规则的方法。例如,作为关于文本列的规则,采用“IF(条件)then(发音记号)”,当文本的一部份符合条件时使用该规则。具有用规则完全地置换单词辞典仅以规则进行变换的情形和对单词辞典和规则进行组合来进行变换的情形。采用组合单词辞典和规则时的文本发音记号变换装置的声音合成系统用的单词辞典尺寸减小装置,例如记载于专利文献1。
图29是显示专利文献1揭示的单词辞典尺寸减小装置的处理的框图。单词辞典尺寸减小装置,通过由两个阶段构成的处理删除登录到单词辞典的单词,减小单词辞典尺寸。首先,在第一阶段中,将登录于原先单词辞典的单词中的采用规则生成正确发音记号列的单词作为从单词辞典删除的候补。作为规则,例示有由接头辞用规则和插入辞(接中辞)用规则和接尾辞用规则组成的规则。
接着,在第二阶段中,在单词辞典内的单词能够作为其他单词的词根(root word)使用的情况下,该单词作为词根留在单词辞典中。这样,成为词根的单词即使在第一阶段被作为删除对象的候补也将其从删除对象中排除。另一方面,在文字数多的单词中,对于不是作为词根留在单词辞典中的对象,而是通过一个以上的词根和规则生成正确发音记号列的单词,将其作为从单词辞典中删除的对象。
当第一阶段和第二阶段结束后,通过将最终被判定为删除对象的单词从单词辞典中删除,可生成尺寸减小后的单词辞典。这样生成的单词辞典,由于是根据规则无法得到发音记号列的例外语的辞典,因此也被称为“例外语辞典”。
现有技术文献
专利文献
专利文献1:美国专利第6,347,298号
发明内容
发明所要解决的问题
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于旭化成株式会社,未经旭化成株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980131687.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电视节目归档方法和系统
- 下一篇:一种节水防冻器