[发明专利]翻译隐藏式字幕的领域自适应便携机器翻译设备及其方法有效
申请号: | 200710142439.8 | 申请日: | 2007-08-27 |
公开(公告)号: | CN101131691A | 公开(公告)日: | 2008-02-27 |
发明(设计)人: | 金永吉;梁成一;金昌显;徐英爱;洪文杓;崔承权;李起荣;权五郁;卢玧亨;朴相奎 | 申请(专利权)人: | 韩国电子通信研究院 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/27;H04N5/278 |
代理公司: | 北京市柳沈律师事务所 | 代理人: | 胡琪;郭定辉 |
地址: | 韩国*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 翻译 隐藏 字幕 领域 自适应 便携 机器翻译 设备 及其 方法 | ||
相关申请的交叉引用
本发明要求2006年8月25日提交的韩国专利申请第2006-80921号的优先权和利益,通过引用将该申请的全部内容合并于此。
技术领域
本发明涉及一种使用动态翻译资源用于隐藏式字幕(closed caption)的领域自适应便携机器翻译设备及其方法。更具体地,本发明涉及一种机器翻译设备及其方法,其可以通过动态地构建适合于自动识别的字幕语句的风格和领域的特定的翻译模块和知识,以及利用优化的翻译资源自动地翻译对应的语句,来改进在各个专门领域的翻译性能。
背景技术
虽然已经成功地将日语-韩语/韩语-日语机器翻译系统商业化,但是用于在诸如韩语-英语/英语-韩语以及韩语-汉语/汉语-韩语翻译等的完全不同的样式(heterogeneous pattern)的语言之间的翻译的大多数机器翻译系统只取得了很小的商业成功。其原因在于:虽然翻译性能依赖于要翻译的目标语言和段落而变化,但当在完全不同的样式的语言之间翻译时,机器通常呈现出较差的性能。
近来,通过创建为在特定领域的应用中的语句特性编程的专门的机器翻译系统,而做出尝试以增强输出质量。作为这样的努力的结果,已经以不同程度的成功对用于诸如技术手册领域、专利领域、圣经翻译领域等的部分专门的领域的翻译系统实现了商业化。
具体地,通过卫星TV的广泛传播的推动,存在对于用于隐藏式字幕的机器翻译系统的不断增长的需求,其可通过自动翻译从广播信号中提取的字幕信号而为观众提供选择他/她们的语言的字幕。
这里,隐藏式字幕指从广播站输出的包含字幕信号的图像信号。近来,许多广播公司为听力受损提供这样的隐藏式字幕。1990年,美国要求13英尺或更大的电视机必须具有隐藏式字幕功能,本地电视广播站和CATV公司也正在扩展隐藏式字幕节目。同样,预计继续扩展由CNN、NHK、AFKN提供的外语的隐藏式字幕的节目。
然而,在TV上的隐藏式字幕中,口语风格和书面风格在各种类型中混合,例如,戏剧、文化和时事、娱乐等等、以及新闻。特别地,在新闻中,几乎使用来自所有领域的各种技术术语和表述,因此开发可提供商业规模的高质量输出的用于隐藏式字幕的机器翻译系统存在技术上的困难。
为了克服此技术困难,韩国专利公开第1997-56985号(公开日:1997年7月31日)公开了具有用于翻译隐藏式字幕的功能的TV。该TV将韩语和外语翻译部分分开,从而以观众选择的语言显示字幕数据,因此便利地满足观众的需要。
然而,具有隐藏式字幕功能的TV执行以下处理:从输入广播信号提取字幕数据,将该字幕数据翻译为所选择的语言,接着在TV屏幕上显示翻译的结果。因此,其缺点在于:必须单独购买支持隐藏式字幕的TV,而且当广播信号是从另一媒体设备(例如,卫星机顶盒、视频播放器、DMB终端等)输入时,无法提供字幕功能。
此外,具有隐藏式字幕功能的TV只对字幕数据执行翻译,因此对于口语风格、书面风格的语句、以及在有字幕的节目中处理的各种技术领域中使用的语句,其不能提供高输出质量。
例如,在新闻中,通常将“die”用作意思为“停止生命”的动词,但在科学领域中,最经常地将“die”用作意思为“模具”的名词。因此,如果在科学领域字幕中将“die”误翻译为意思为“停止生命”的动词,这是因为翻译是在没有考虑应用领域的情况下执行的。
也就是说,因为具有翻译隐藏式字幕的功能的TV将相同的翻译模块和知识作为一个整体应用于所有的领域,因此当输入各种风格和技术的语句时,显然翻译质量将会降级。
因此,进行了许多考虑技术领域而改进翻译质量的尝试。代表性的方法是用户自适应机器翻译方法,其中校正翻译的结果中的错误,将校正的结果存储为补充的翻译知识,并在下次自动应用该翻译知识,借此改进相似输入语句的翻译质量。
作为上述的用户自适应机器翻译方法,通常使用基于翻译存储器的自适应翻译方法,其中用户添加他/她自己的翻译词典,或手动注册基于样式的翻译集(corpus),并接着将结果应用于语句翻译。
韩国专利公开第2004-0111188号(公开日:2004年12月31日)公开了一种相关的、传统的自适应机器翻译方法。在韩国专利公开第2004-0111188号中公开的自适应机器翻译方法通过防止重复错误而改进翻译质量。这通过机器翻译系统的用户直接校正错误、将校正的结果转换为系统的输入知识格式、并接着将转换的结果再次应用于翻译系统来完成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于韩国电子通信研究院,未经韩国电子通信研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710142439.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于植入式医疗装置的焊板触点
- 下一篇:半导体存储器设备