[发明专利]声音处理系统有效
申请号: | 201380036292.8 | 申请日: | 2013-07-01 |
公开(公告)号: | CN104488027B | 公开(公告)日: | 2018-03-30 |
发明(设计)人: | 杉浦孔明;大熊英男;木村法幸;志贺芳则;林辉昭;水上悦雄 | 申请(专利权)人: | 独立行政法人情报通信研究机构 |
主分类号: | G10L25/69 | 分类号: | G10L25/69 |
代理公司: | 中科专利商标代理有限责任公司11021 | 代理人: | 李逸雪 |
地址: | 日本国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 处理 系统 以及 终端 装置 | ||
1.一种声音处理系统,包括:终端装置和声音处理服务器,其中,
所述终端装置包括:讲话输入部件,用于接受讲话信息的输入,该讲话信息包含表示讲话的声音信号和表示完成该讲话的环境的规定环境信息,
所述声音处理服务器包括:
声音识别部件,用于对所述讲话输入部件接受的讲话信息内的声音信号进行声音识别,并将识别结果作为文本来输出;
数据处理部件,对所述声音识别部件输出的文本执行规定的数据处理;
讲话连续模型存储部件,用于存储以统计方式学习完毕的讲话连续模型,统计方式学习完毕的讲话连续模型如下:如果接受了讲话的文本和所述规定环境信息,则能够针对规定的讲话集合之中的讲话,计算出由所述文本表示的讲话之后连续讲出的概率;
讲话存储部件,用于存储所述数据处理部件对所述规定的讲话集合内的讲话和针对该讲话集合内的各个讲话进行了处理时的数据处理的可靠度;以及
讲话候补推荐部件,使用所述声音识别部件对所述讲话输入部件接受的讲话信息的识别结果和该讲话信息中包含的环境信息,基于以规定的形式将使用存储在所述讲话连续模型存储部件中的所述讲话连续模型对所述规定集合内的各讲话计算出的概率和存储在所述讲话存储部件中的针对所述规定集合内的各讲话的所述数据处理的可靠度进行组合而得到的评价得分,在多个所述讲话的集合内,对推荐给进行了所述声音识别部件识别出的讲话的用户的讲话候补附加得分,并基于所附加的得分而向用户推荐讲话候补。
2.根据权利要求1所述的声音处理系统,其中,
所述数据处理部件包括自动翻译部件,该自动翻译部件受理接受某讲话后所述声音识别部件输出的识别结果,将该识别结果自动翻译成与所述某讲话的语言不同的其他语言,并作为文本来输出,
所述可靠度是该自动翻译部件的翻译结果作为相对于所述某讲话的所述其他语言的翻译的似然性。
3.根据权利要求2所述的声音处理系统,其中,
所述数据处理部件还包括声音合成部件,该声音合成部件用于基于所述自动翻译部件输出的所述其他语言的文本来对所述其他语言的声音信号进行合成。
4.根据权利要求1~3中任一项所述的声音处理系统,其中,
所述讲话候补推荐部件包括以下部件,该部件用于基于使用所述讲话连续模型对所述规定集合内的各讲话计算出的概率与存储在所述讲话存储部件中的针对所述规定集合内的各讲话的可靠度之间的线性和的评价,在多个所述讲话的集合内推测所述声音识别部件进行声音识别的讲话之后的后续讲话的候补,
所述线性和中的所述可靠度和所述概率的系数都是正数。
5.根据权利要求1~3中任一项所述的声音处理系统,其中,
所述声音处理系统还包括讲话候补提示部件,该讲话候补提示部件用于向用户提示由所述讲话候补推荐部件推荐的讲话候补。
6.根据权利要求1~3中任一项所述的声音处理系统,其中,
所述声音处理系统还包括讲话文本信息输入部件,该讲话文本信息输入部件用于接受包含表示讲话的文本和所述规定环境信息在内的讲话文本信息的输入,取代所述声音识别部件的输出而向所述讲话候补推荐部件以及所述数据处理部件提供该讲话文本信息内的文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于独立行政法人情报通信研究机构,未经独立行政法人情报通信研究机构许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380036292.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于核反应堆的电馈通
- 下一篇:用户专用的自动语音识别