[发明专利]具有人机对话功能的拟人化口语翻译方法及系统在审
申请号: | 201710535661.8 | 申请日: | 2017-07-03 |
公开(公告)号: | CN107315742A | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 陈炜;王峰;徐爽;徐波 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/30;G10L13/02;G10L15/00;G10L15/18;G10L15/26;G10L25/48 |
代理公司: | 中科专利商标代理有限责任公司11021 | 代理人: | 任岩 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 具有 人机对话 功能 拟人化 口语翻译 方法 系统 | ||
技术领域
本发明涉及计算机和人工智能领域,尤其涉及一种把拟人化的人机对话机制加入翻译过程中的口语翻译方法及相应的系统。
背景技术
随着互联网的普及应用和全球化的快速推进,口语翻译作为对人工翻译高成本、高门槛、供需失衡等问题的有效解决方案,在日常生活、商务洽谈、国际交流等多个场景下具有旺盛的市场需求。
两种语言的口语翻译技术由图1所示构成,包括源语言和目标语言的语音识别、语音合成和双向翻译技术。其中双向语音识别和双向翻译是必须包含的技术,而语音合成则视翻译应用场景和设备而可选。
传统的口语自动翻译方法,一般由用户输入待翻译的源语言语音,自动识别并翻译后直接将目标语言的自然语音呈现给对方用户,口语识别或者翻译从用户视角仅仅是一种端到端的软件(如图2所示)。
受困于人类沟通语言的复杂性和多变性,即使人类翻译员也会通过各种方式与对话者进行沟通,以求获得对所需要翻译语音的准确内涵。而目前机器口语翻译方法,是一种不对实际场景复杂性和语义复杂性情况进行处理的端到端呈现翻译方法,显然难以满足准确度要求。同时由于翻译作为一个软件服务缺乏与用户的人机沟通,在实际应用场景中也难以满足场景友好性的要求。如何提高实际复杂场景下口语翻译准确率和用户体验是当前需要解决的问题。
发明内容
(一)要解决的技术问题
鉴于上述技术问题,本发明提供了一种具有人机对话功能的拟人化口语翻译方法及系统。本发明的核心点是在原有语音识别和翻译的基础上,加入一个人机对话模块,该模块捕捉、处理和识别当时的声学场景、话者场景、韵律场景、语言场景等,根据翻译任务需要在必要时跟用户进行人机对话,确切地获得能够显著提升复杂应用场景下用户的翻译体验,并提高翻译语义的准确度。
(二)技术方案
根据本发明的一个方面,提供了一种具有人机对话功能的拟人化口语翻译方法,其包括以下步骤:对源语言语音进行智能语音识别,得到源语言文本;对源语言文本以及对话场景进行处理,进行拟人化人机对话沟通;进行机器翻译,得到翻译结果。
根据本发明的另一个方面,还提供了一种具有人机对话功能的拟人化口语翻译系统,其包括:语音识别模块、人机对话管理模块、机器翻译模块,语音识别模块用于对源语言语音进行智能语音识别,得到源语言文本;人机对话管理模块用于对源语言文本以及对话场景进行处理,进行拟人化人机对话沟通;机器翻译模块用于进行机器翻译,得到翻译结果。
(三)有益效果
从上述技术方案可以看出,本发明具有人机对话功能的拟人化口语翻译方法及系统至少具有以下有益效果其中之一:
(1)本发明能够显著提升复杂应用场景下翻译性能的准确性;
(2)本发明使得用户使用更方便,交谈过程中不需再做其他任何冗余操作;
(3)本发明使得用户翻译及交互体验更智能、更人性化。
附图说明
图1为现有技术两种语言的口语翻译技术示意图。
图2为现有技术口语自动翻译系统示意图。
图3为本发明一种具有人机对话功能的拟人化口语翻译系统示意图。
图4为本发明一种具有人机对话功能的拟人化口语翻译系统的语音识别模块的结构示意图。
图5为本发明一种具有人机对话功能的拟人化口语翻译系统的详细示意图。
图6为本发明第一实施例中获取说话者输入的源语言语音方法的示意图。
图7为本发明第一实施例中跟说话者进行人机对话方法的示意图。
图8为本发明第一实施例中可视化向说话者展示当前系统状态的方法的示意图。
图9为本发明第一实施例中向对话另一方智能输出翻译结果的方法的示意图。
图10为本发明第二实施例中获取会议信息并创建会议的方法的示意图。
图11为本发明第二实施例中智能主持会议进程的方法的示意图。
图12为本发明第二实施例中可视化向参会者展示当前会议状态的方法的示意图。
图13为本发明第三实施例一种基于无屏幕显示的拟人化口语翻译系统的翻译方法示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710535661.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语义分析方法
- 下一篇:基于移动终端的用户交互界面的表情搜索方法及装置