[发明专利]信息处理方法、装置、设备以及计算机可读存储介质在审
申请号: | 202010568062.8 | 申请日: | 2020-06-19 |
公开(公告)号: | CN113822082A | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 张斯曼;郭垿宏;刘巍;李安新;陈岚;村上聪一朗 | 申请(专利权)人: | 株式会社NTT都科摩 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/289;G06F40/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张晓明 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 装置 设备 以及 计算机 可读 存储 介质 | ||
提供了一种信息处理方法、装置、设备以及计算机可读存储介质。该包括:获取第一待处理信息;若所述第一待处理信息中包括第一指代词,则从一个或多个候选词集合中选取包括所述第一指代词的第一候选词集合,所述一个或多个候选词集合中的每个候选词集合包括至少两个意思一致但表述不一致的候选词;通过约束模型,获取所述第一候选词集合中的所述第一指代词对应的翻译的第一约束结果;以及根据所述第一约束结果,对所述第一待处理信息的翻译结果进行修正,生成第二待处理信息。
技术领域
本申请涉及信息处理领域,并且具体涉及一种信息处理方法、装置、设备以及计算机可读存储介质。
背景技术
当进行语言翻译时,语义相同的词语可能在文章中有不同的表述,因此,确保文章前后所有的翻译词语的一致性非常重要。尤其是在长文档(特别是法律文书等)的翻译的时候,保持文章前后词语翻译的一致性尤为重要。
发明内容
鉴于上述问题,本公开提供了一种信息处理方法、装置、设备以及计算机可读存储介质。
根据本公开的一个方面,提供了一种信息处理方法,包括:获取第一待处理信息;若所述第一待处理信息中包括第一指代词,则从一个或多个候选词集合中选取包括所述第一指代词的第一候选词集合,所述一个或多个候选词集合中的每个候选词集合包括至少两个意思一致但表述不一致的候选词;通过约束模型,获取所述第一候选词集合中的所述第一指代词对应的翻译的第一约束结果;以及根据所述第一约束结果,对所述第一待处理信息的翻译结果进行修正,生成第二待处理信息。
根据本公开的一个示例,所述通过约束模型,获取所述第一候选词集合中的所述第一指代词对应的翻译的第一约束结果包括:将所述第一候选词集合中的各个候选词和各个候选词的一个或多个翻译结果进行配对,作为翻译对;基于各个翻译对的特征和/或各个翻译对的语义空间的表示,获取所述第一约束结果。
根据本公开的一个示例,所述约束模型是基于监督的第一约束模型,所述基于各个翻译对的特征和/或各个翻译对的语义空间的表示,获取所述第一约束结果包括:通过所述第一约束模型,基于各个翻译对的特征,获取所述第一约束结果,其中,所述基于监督的第一约束模型是利用训练数据训练得到的。
根据本公开的一个示例,所述约束模型是基于非监督的第二约束模型,所述基于各个翻译对的特征和/或各个翻译对的语义空间的表示,获取所述第一约束结果包括:通过所述第二约束模型,基于各个翻译对的语义空间的表示,获取所述第一约束结果,其中,所述基于非监督的第二约束模型无需提前训练。
根据本公开的一个示例,所述通过所述第二约束模型,基于各个翻译对的语义空间的表示,获取所述第一约束结果包括:基于所有翻译对的语义空间的中心表示与各个翻译对的语义空间的表示之间的距离,获取所述第一约束结果。
根据本公开的一个示例,所述约束模型是包括基于监督的第一约束模型和基于非监督的第二约束模型的第三约束模型,所述基于各个翻译对的特征和/或各个翻译对的语义空间的表示,获取所述第一约束结果包括:通过所述第二约束模型,基于各个翻译对的语义空间的表示,获取包括N个翻译对的第二候选词集合,N为大于或等于2的整数;以及通过所述第一约束模型,基于所述第二候选词集合中的各个翻译对的特征,获取所述第一约束结果,其中,所述基于监督的第一约束模型是利用训练数据训练得到的,所述基于非监督的第二约束模型无需提前训练。
根据本公开的一个示例,所述距离为欧式距离。
根据本公开的一个示例,所述翻译对的特征包括翻译被选的频率、是否最近被选择、翻译长度、是否包含在正式词中、语义相关度中的一个或多个。
根据本公开的一个示例,所述第一待处理信息为第一处理文本的一部分,所述一个或多个候选词集合是基于所述第一处理文本、或基于所述第一待处理信息之前的一个或多个待处理信息生成的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社NTT都科摩,未经株式会社NTT都科摩许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010568062.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种不易变形的CPVC电缆保护管
- 下一篇:信号处理方法与装置