[发明专利]一种转换方法、装置和电子设备有效

专利信息
申请号: 201811320804.4 申请日: 2018-11-07
公开(公告)号: CN109558599B 公开(公告)日: 2023-04-18
发明(设计)人: 郑宏 申请(专利权)人: 北京搜狗科技发展有限公司
主分类号: G06F40/56 分类号: G06F40/56
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 莎日娜
地址: 100084 北京市海淀区中关*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 转换 方法 装置 电子设备
【说明书】:

发明实施例提供了一种转换方法、装置和电子设备,其中,所述方法包括:获取待处理文本;确定所述待处理文本中目标记数文本对应的数字类型,其中,所述目标记数文本用于表示数字;按照所述数字类型对应的转换规则对所述目标记数文本进行转换,得到目标数字;将所述待处理文本中目标记数文本替换为对应的目标数字并输出;进而在后续机器翻译过程中,可以直接对数字进行翻译,得到目标语言中用于表示该数字的文本,从而提高对数字翻译的准确率。

技术领域

本发明涉及数据处理技术领域,特别是涉及一种转换方法、装置和电子设备。

背景技术

人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作;自人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,如机器翻译领域,如将汉语翻译成英语、将英语翻译成汉语等等。

随着机器翻译技术不断的成熟,基于机器的同传翻译应运而生,同传翻译可以包括两个处理过程:语音处理和机器翻译,语音处理包括将语音数据转换成文本,以及将机器翻译得到的翻译文本转换成语音;机器翻译是将语音文本翻译成目标语言对应的翻译文本。目前,机器翻译是基于神经网络进行翻译的,而用于训练神经网络的语料库中的语料是有限的,因此可能会导致对数字的翻译出现错误;例如:“one hundred twenty threemillion three thousand two hundred and twenty two”,会被翻译为“一百二十三万三千二百二十”。

发明内容

本发明实施例提供一种转换方法,以提高数字翻译的准确率。

相应的,本发明实施例还提供了一种转换装置和一种电子设备,用以保证上述方法的实现及应用。

为了解决上述问题,本发明实施例公开了一种转换方法,具体包括:获取待处理文本;确定所述待处理文本中目标记数文本对应的数字类型,其中,所述目标记数文本用于表示数字;按照所述数字类型对应的转换规则对所述目标记数文本进行转换,得到目标数字;将所述待处理文本中目标记数文本替换为对应的目标数字并输出。

可选地,所述确定所述待处理文本中目标记数文本对应的数字类型,包括:依据所述待处理文本对应的语言,确定对应的目标正则表达式;依据所述目标正则表达式,确定所述待处理文本中目标记数文本对应的数字类型。

可选地,所述目标正则表达式包括第一正则表达式和第二正则表达式,所述依据所述目标正则表达式,确定所述待处理文本中目标记数文本对应的数字类型,包括:将所述待处理文本与所述第一正则表达式进行匹配,提取目标记数文本;依次将所述目标记数文本与各第二正则表达式匹配,确定与所述目标记数文本匹配的第二正则表达式匹配;将匹配的第二正则表达式对应的数字类型,确定为所述目标记数文本对应的数字类型;其中,所述第一正则表达式依据多个第二正则表达式构建而成,所述第二正则表达式与数字类型对应,所述数字类型依据记数文本的构成规则确定。

可选地,所述按照所述数字类型对应的转换规则转换所述目标记数文本得到目标数字,包括:基于所述数字类型查找映射关系,确定所述目标记数文本对应的转换规则,所述转换规则包括第一关联关系和第二关联关系;依据所述第一关联关系,确定所述目标记数文本对应的数字;依据所述第二关联关系和所述目标记数文本对应的数字,生成目标数字。

可选地,在确定所述待处理文本中目标记数文本对应的数字类型之前,所述的方法还包括确定数字类型的步骤:针对一种语言,获取所述语言中用于表示数字的各记数文本;对所述记数文本进行分析,确定对应的最小单元文本,其中,所述记数文本可以由至少一个最小单元文本构成;依据各记数文本中最小单元文本的文本类型,确定各记数文本对应的数字类型;其中,所述数字类型包括以下至少一种:基数类型、序数类型、百分数类型、分数类型和小数类型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811320804.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top