[发明专利]具有人机对话功能的拟人化口语翻译方法及系统在审
申请号: | 201710535661.8 | 申请日: | 2017-07-03 |
公开(公告)号: | CN107315742A | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 陈炜;王峰;徐爽;徐波 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/30;G10L13/02;G10L15/00;G10L15/18;G10L15/26;G10L25/48 |
代理公司: | 中科专利商标代理有限责任公司11021 | 代理人: | 任岩 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 具有 人机对话 功能 拟人化 口语翻译 方法 系统 | ||
1.一种具有人机对话功能的拟人化口语翻译方法,其包括以下步骤:
对源语言语音进行智能语音识别,得到源语言文本;
对源语言文本以及对话场景进行处理,进行拟人化人机对话沟通;
进行机器翻译,得到翻译结果。
2.根据权利要求1所述的拟人化口语翻译方法,其中,对源语言语音进行智能语音识别时,具体包括以下步骤:
分别给出每帧语音/非语音的概率得分、每帧源语种/目标语种的概率得分;
同步对语音进行双语解码;
利用信息综合输出有意义的识别结果。
3.根据权利要求1所述的拟人化口语翻译方法,其中,对源语言文本以及对话场景进行处理时,包括对声学场景、话者场景、韵律场景、语言场景进行感知。
4.根据权利要求3所述的拟人化口语翻译方法,其中,对声学场景进行感知时,待感知信息包括:动态背景噪声信息。
5.根据权利要求3所述的拟人化口语翻译方法,其中,对话者场景进行感知时,待感知信息包括:说话人信息、语种信息、是否有多人说话、多人说话语音分离信息及其他说话者场景信息。
6.根据权利要求3所述的拟人化口语翻译方法,其中,对韵律场景进行感知时,待感知信息包括:输入语音的中间停顿、断句边界、语速、基频、共振峰及韵律分析置信度以及翻译回合边界。
7.根据权利要求3所述的拟人化口语翻译方法,其中,对语言场景进行感知时,待感知信息包括:
待翻译文本中抽取的人名、地名和机构名;
待翻译文本中可能包含的识别错误的词汇;
待翻译文本中包含的口语化语言碎片和重复;
待翻译文本中包含的明显成分缺失;
待翻译文本中包含的时序颠倒;
待翻译文本中包含的时间数字短语语言信息;
待翻译文本中包含的行业术语、日常缩略语、网络新词、古诗词、成语、俗语、歇后语。
8.根据权利要求1所述的拟人化口语翻译方法,其中,进行拟人化人机对话沟通时,其沟通内容包括:
正确使用方法的提示、改善使用环境或话者环境的提示;
需要进一步语义说明时获取语义说明信息。
9.一种具有人机对话功能的拟人化口语翻译系统,其包括:
语音识别模块,用于对源语言语音进行智能语音识别,得到源语言文本;
人机对话管理模块,用于对源语言文本以及对话场景进行处理,进行拟人化人机对话沟通;
机器翻译模块,用于进行机器翻译,得到翻译结果。
10.根据权利要求9所述的拟人化口语翻译系统,其中,通过可视化拟人化形象展示翻译系统的不同状态,或者通过非可视化的声音媒介展示翻译系统的不同状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710535661.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语义分析方法
- 下一篇:基于移动终端的用户交互界面的表情搜索方法及装置