[发明专利]语音翻译设备和语音翻译方法在审
申请号: | 201410472159.3 | 申请日: | 2014-09-16 |
公开(公告)号: | CN104462071A | 公开(公告)日: | 2015-03-25 |
发明(设计)人: | 釜谷聪史;住田一男;河村聪典 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G10L15/26 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 周良玉;杨晓光 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 翻译 设备 方法 | ||
技术领域
这里描述的实施例总体上涉及语音翻译设备和语音翻译方法。
背景技术
存在有机器翻译装置,该机器翻译装置用以接受以第一语言描述的源语言的字符串的输入,并且将字符串翻译成用第二语言(用户希望的语言)描述的另一字符串。此外,通过语音语言处理技术的最近发展,实现了用以将一个用户(第一说话者)说出的第一语言的语音翻译成第二语言并且输出至另一用户(第二说话者)的语音翻译装置。
在语音翻译装置目前使用的语音识别词典和翻译词典中,仅存储由开发者提供的在一个范围内的词汇。尤其地,在语音翻译装置中,通过基于使用该装置的场景或者情况来限制或者转换可识别的词汇和可翻译的词汇,性能得以提高。可以通过这样的事实来想象这个原因,即与不具有前提了解相比,如果用户具有一些程度的前提了解而听谈话,对于用户来说,理解谈话是更容易的。
在另一方面,在PCT国际公开WO 2009/129315中公开了用以将第一语言的新词翻译成第二语言并且将此翻译结果登记到用于第二语言的语音识别词典中的技术。
在通过语音诠释(interpretation)装置的实际会话中,通过听相互发声并且通过在第一和第二说话者之间确认各自的诠释结果,会话得以推进。对于在另一方的语言(第二说话者的语言)中不存在的词,例如,在从日语到汉语的翻译中,或者从日语到英语的翻译中,该词被音译为以拉丁字母方式的表达。此外,在将英语翻译成日语中,以字母方式的表达将该词原样输出,或者将该词音译成以日语字音表(假名)方式的表达。
在这种情况下,当另一方(第二说话者)不可以依据翻译结果的表达评估语音时,另一方常常基于第一说话者的发声而发声。相应地,如果语音识别词典根据传统技术仅通过词的表达而更新,用与语音识别词典所不同的发音说出该词,该词不能被正确地识别。
例如,考虑日语词“納豆(Nattou)”(发酵的大豆)。该词被翻译成汉语“納豆”(拼音(汉语拼音系统):na4dou4)和英语词“Natto”。当外国人观看此翻译结果并且尝试在接下来的语音中说出此词时,除了通过观看他/她的母语的表达的发声之外,外国人通常通过模仿日语发音“Nattou”而说出。该日语发音“Nattou”没有直接关联到汉语词“納豆”和英语词“Natto”。相应地,在用以识别外国人的发声的传统技术中,该传统技术仅使用依据翻译结果的字符串而评估的发音,外国人的发声的语音识别是失败的。
此外,为了提高翻译准确性,考虑将所有可翻译的词和所有作为翻译结果而获得的词事先登记到语音识别词典中。然而,如果可识别的词的数目无序地增加,生成具有类似于正确词的发声的非正确词的可能性被提高。于是,诠释准确性并不总是被改善。
发明内容
实施例提供一种语音识别设备和语音识别方法,所述设备和方法能够识别这样的词,该词对应的发音具有很高的可能性由说话者在流畅会话中说出。
根据一个实施例,一种语音翻译设备包括语音识别单元、翻译单元、未知词检测单元、发音评估单元和词典更新单元。所述语音识别单元被配置为,通过使用用以识别第一语言和第二语言的语音识别词典识别语音,将第一语言的语音转换成第一语言的源句子。所述翻译单元被配置为将所述源句子转换成所述第二语言的翻译句子。所述未知词检测单位被配置为检测包括在所述翻译句子中的未知词。所述未知词没有被存储在所述语音识别词典中。所述发音评估单元被配置为依据所述未知词的表达,来评估所述未知词的第一发音候选,并且依据对应于所述未知词的、所述源句子中包括的原始词的发音,来评估所述未知词的第二发音候选。词典更新单元被配置为将所述未知词、所述第一发音候选和所述第二发音候选相应地登记到所述语音识别词典中。
根据实施例,可以提供一种语音识别设备和一种语音识别方法,所述设备和方法能够识别这样的词,该词对应的发音具有很高的可能性由说话者在流畅会话中说出。
附图说明
图1为根据各种实施例的语音翻译设备的框图。
图2为根据第一实施例的语音翻译设备的处理的流程图。
图3为对应于源语言发音的语音识别结果和翻译结果的一个实例。
图4为从图3的翻译结果检测到的未知词A和B。
图5为根据第一实施例的发音对应表的一个实例。
图6为根据第一实施例的登记到语音识别词典中的发音候选的一个实例。
图7为根据第二实施例的语音翻译设备的处理的流程图。
图8为根据第二实施例的语际发音对应表的一个实例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410472159.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种网页模版的生成方法及装置
- 下一篇:基于拦截器的分布式数据缓存方法