[发明专利]语音翻译系统、第一终端装置、语音识别服务器装置、翻译服务器装置以及语音合成服务器装置有效
申请号: | 201080043645.3 | 申请日: | 2010-03-03 |
公开(公告)号: | CN102549653A | 公开(公告)日: | 2012-07-04 |
发明(设计)人: | 中村哲;隅田英一郎;苇苅丰;木村法幸;堀智织 | 申请(专利权)人: | 独立行政法人情报通信研究机构 |
主分类号: | G10L15/10 | 分类号: | G10L15/10;G06F3/16;G06F17/28;G10L13/00;G10L15/00;G10L15/22;G10L15/28 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 姜虎;陈英俊 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 翻译 系统 第一 终端 装置 识别 服务器 以及 合成 | ||
技术领域
本发明涉及进行语音翻译的语音翻译系统等。
背景技术
在现有的语音翻译系统中,存在着用于提高语音识别精度或者翻译处理精度等的提高各部分处理精度的技术(例如,参照专利文献1、专利文献2)。
【专利文献1】:日本特开2008-243080号公报(第1页,图1等)
【专利文献2】:日本特开2009-140503号公报(第1页,图1等)
发明内容
发明所要解决的技术问题
但是,在现有的语音翻译系统中,在语音翻译过程中,不能根据说话者的属性来变更进行语音识别、翻译或语音合成的装置或模型,因此,在语音识别、翻译或语音合成的各处理中,精度降低、或者发生不恰当的输出。
用于解决技术问题的方案
本发明的第一方案的语音翻译系统,具有输入语音的第一终端装置、2个以上语音识别服务器装置、一个以上翻译服务器装置以及一个以上语音合成服务器装置,上述第一终端装置具备:第一说话者属性保存部,可保存一个以上的作为说话者的属性值的说话者属性;第一语音接受部,接受语音;第一语音识别服务器选择部,根据上述一个以上说话者属性,选择上述2个以上语音识别服务器装置中的一个语音识别服务器装置;以及第一语音发送部,向上述第一语音识别服务器选择部选择的语音识别服务器装置,发送由上述第一语音接受部所接受的语音构成的语音信息,上述语音识别服务器装置具备:语音识别模型保存部,关于2个以上语言中的所有语言或2个以上的一部分语言,可保存语音识别模型;语音信息接收部,接收上述语音信息;语音识别部,利用上述语音识别模型保存部的语音识别模型,对上述语音信息接收部所接收的语音信息进行语音识别,取得语音识别结果;以及语音识别结果发送部,发送上述语音识别结果上述翻译服务器装置具备:翻译模型保存部,关于上述2个以上语言中的所有语言或2个以上的一部分语言,可保存翻译模型;语音识别结果接收部,接收上述语音识别结果;翻译部,利用上述翻译模型保存部的翻译模型,将上述语音识别结果接收部所接收的语音识别结果翻译成目标语言,并取得翻译结果;以及翻译结果发送部,发送上述翻译结果,上述语音合成服务器装置具备:语音合成模型保存部,关于上述2个以上语言中的所有语言或2个以上的一部分语言,可保存语音合成模型;翻译结果接收部,接收上述翻译结果;语音合成部,利用上述语音合成模型保存部的语音合成模型,对上述翻译结果接收部所接收的翻译结果进行语音合成,并取得语音合成结果;以及语音合成结果发送部,向第二终端装置发送上述语音合成结果。
根据该结构,在语音翻译过程中,能够根据说话者的属性来变更进行语音识别的装置,在语音识别处理中,提高精度。
此外,本发明的第二方案的语音翻译系统,具有输入语音的第一终端装置、一个以上语音识别服务器装置、一个以上翻译服务器装置以及一个以上语音合成服务器装置,上述第一终端装置具备:第一语音接受部,接受语音;以及第一语音发送部,向上述语音识别服务器装置发送由上述第一语音接受部接受的语音构成的语音信息,上述语音识别服务器装置具备:第三说话者属性保存部,能够保存一个以上作为说话者的属性值的说话者属性;语音识别模型保存部,关于2个以上语言中的所有语言或2个以上的一部分语言,可保存2个以上语音识别模型;语音信息接收部,接收上述语音信息;语音识别模型选择部,根据上述一个以上说话者属性,从上述2个以上语音识别模型中选择一个语音识别模型;语音识别部,利用上述语音识别模型选择部选择的语音识别模型,对上述语音信息接收部所接收的语音信息进行语音识别,取得语音识别结果;以及语音识别结果发送部,发送上述语音识别结果,上述翻译服务器装置具备:翻译模型保存部,关于上述2个以上语言中的所有语言或2个以上的一部分语言,可保存翻译模型;语音识别结果接收部,接收上述语音识别结果;翻译部,利用上述翻译模型保存部的翻译模型,将上述语音识别结果接收部所接收的语音识别结果翻译成目标语言,并取得翻译结果;以及翻译结果发送部,发送上述翻译结果,上述语音合成服务器装置具备:语音合成模型保存部,关于上述2个以上语言中的所有语言或2个以上的一部分语言,可保存语音合成模型;翻译结果接收部,接收上述翻译结果;语音合成部,利用上述语音合成模型保存部的语音合成模型,对上述翻译结果接收部所接收的翻译结果进行语音合成,并取得语音合成结果;以及语音合成结果发送部,向第二终端装置发送上述语音合成结果。
根据该结构,在语音翻译过程中,能够根据说话者的属性来变更进行语音识别的模型,在语音识别处理中,提高精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于独立行政法人情报通信研究机构,未经独立行政法人情报通信研究机构许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080043645.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:玉蝉花的纳米组织培养方法
- 下一篇:显示改善的耐冲击性的聚羟基链烷酸酯组合物