[发明专利]翻译信息的方法和装置有效
申请号: | 201510119654.0 | 申请日: | 2015-03-18 |
公开(公告)号: | CN104699675B | 公开(公告)日: | 2018-01-30 |
发明(设计)人: | 徐金安;赵雁榕;韩晓光;肖冰;徐凡;陈钰枫 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京三高永信知识产权代理有限责任公司11138 | 代理人: | 滕一斌 |
地址: | 100044*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 翻译 信息 方法 装置 | ||
技术领域
本发明涉及自然语言处理研究领域,特别涉及一种翻译信息的方法和装置。
背景技术
当前,随着计算机网络和通信技术的发展,移动终端越来越普及,电子邮件、短信、Facebook、QQ、微信、微博等各种社交媒体越来越多渗透到人们的日常工作和生活。在人们的日常交流活动中,短文本信息大量出现,且文字中夹杂各种各样有多重符号串组成的表情符号。
另一方面,互联网技术和通信技术的发展不断拓展人们的交往空间,人们的交流变得越来越跨国界,将信息进行翻译是人们进行异文化交流的重要手段,尤其是当用户的异国语言较差时,当看到异国语言的信息时,一般会使用机器翻译来将信息翻译成目标语言。其中,信息中可能包含大量的表情符号,机器翻译往往采用翻译词典来将表情符号翻译成目标语言,其中翻译词典中包括表情符号和其对应的目标语言格式的词语。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
由于表情符号是在不断变化的,导致构造翻译词典的费工费时,成本高,当信息中的某表情符号不在翻译词典、翻译模型或者翻译实例中时,就无法对该表情符号进行翻译。
发明内容
为了解决现有技术中的问题,本发明提供了一种翻译信息的方法。所述技术方案如下:
一方面,本发明提供了一种翻译信息的方法,所述方法包括:
获取源语言格式的第一信息中包含的表情符号;
在所述第一信息中将所述表情符号置换为用于标识所述表情符号的第一标识得到第二信息;
将所述第二信息翻译为目标语言格式的第三信息;
从所述第三信息中提取与所述第一标识相对应的第二标识;
在所述第三信息中将所述第二标识置换为所述第二标识对应的表情符号得到第四信息。
进一步地,所述第一标识为临时变量,所述临时变量的形式在每种语言格式中都相同;
所述在所述第一信息中将所述表情符号置换为用于标识所述表情符号的第一标识得到第二信息,包括:
为所述表情符号分配临时编号;
在所述第一信息中将所述表情符号置换为所述表情符号的临时编号得到第五信息;
根据所述表情符号在所述第一信息中的位置为所述表情符号分配临时变量;
关联所述表情符号的临时变量和临时编号;
在所述第五信息中将所述表情符号的临时编号置换为与所述表情符号的临时编号相关联的临时变量得到第二信息。
进一步地,所述第二标识为临时变量,所述从所述第三信息中提取与所述第一标识相对应的第二标识,包括:
从所述第三信息中提取所述第三信息包含的临时变量;
相应地,所述在所述第三信息中将所述第二标识置换为所述第二标识对应的表情符号得到第四信息,包括:
获取与所述临时变量相关联的临时编号;
在所述第三信息中将所述临时变量置换为与所述临时变量相关联的临时编号得到第六信息;
获取所述临时编号对应的表情符号;
在所述第六信息中将所述临时编号置换为所述临时编号对应的表情符号得到第四信息。
进一步地,所述第一标识为所述表情符号对应的词语,所述词语的语言格式为源语言格式;
所述在所述第一信息中将所述表情符号置换为用于标识所述表情符号的第一标识得到第二信息,包括:
根据所述表情符号,获取所述表情符号的属性信息;
根据所述表情符号的属性信息获取所述表情符号对应的至少一个词语;
将所述第一信息中的所述表情符号分别置换为所述至少一个词语中的每个词语,得到所述每个词语对应的第二信息。
进一步地,所述根据所述表情符号,获取所述表情符号的属性信息,包括:
根据所述表情符号的图标数据,从图标数据与索引号的对应关系中获取所述表情符号的索引号;
根据所述表情符号的索引号,从源语言对应的索引号与属性信息的对应关系中获取所述表情符号的属性信息。
进一步地,所述根据所述表情符号的属性信息获取所述表情符号对应的至少一个词语,包括:
计算所述表情符号的属性信息分别与语义词典中的每个属性信息之间的相似度,所述语义词典用于存储属性信息与词语的对应关系;
从所述语义词典中获取与所述表情符号的属性信息之间的相似度满足预设条件的至少一个属性信息;
从所述语义词典中获取所述至少一个属性信息中的每个属性信息对应的词语。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510119654.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于元数据库的数据处理方法
- 下一篇:一种信息输入方法及装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置