[发明专利]一种翻译方法、装置和用于翻译的装置在审
申请号: | 201910100754.7 | 申请日: | 2019-01-31 |
公开(公告)号: | CN111507112A | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 张玉亭;马龙 | 申请(专利权)人: | 搜狗(杭州)智能科技有限公司;北京搜狗科技发展有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 310018 浙江省杭州市经济技*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 翻译 方法 装置 用于 | ||
本发明实施例提供了一种翻译方法、装置和用于翻译的装置。其中的方法具体包括:确定图像中的源语言文本行区域;若确定相邻的源语言文本行区域中包括同一个段落的文本内容,则合并所述相邻的源语言文本行区域,以得到源语言文本段区域;对所述源语言文本段区域中的源语言文本进行翻译,以得到所述源语言文本对应的目标语言文本。本发明实施例可以提高图像翻译的准确率。
技术领域
本发明涉及计算机技术领域,尤其涉及一种翻译方法、装置和用于翻译的装置。
背景技术
随着计算机技术的不断发展,利用翻译工具可以对图像中的文本进行翻译,将图像中的源语言文本翻译为目标语言文本,并且输出翻译后的图像。
例如,参照图1,示出了一种待翻译图像的示意图,该图像中包括源语言为英文的如下源语言文本:“China is leading the world in facial recognition algorithmswith its best algorithm able to recognize 10million people without a singlemistake in less than a second.”,假设目标语言为中文,则该源语言文本对应的翻译结果可以如下:“中国的人脸识别算法在世界上处于领先地位,其中最好的算法能够在不到一秒的时间内识别出一千万人而不会出现任何错误。”
然而,由于在图1所示的图像中,源语言文本分为被分为多个文本行显示,因此,翻译工具会对识别出的多个文本行分别进行翻译,最终输出如图2所示的翻译后的图像。用户最终看到的目标语言文本为:“中国在脸部世界领先”、“最佳识别算法”、“能够识别10的算法”、“百万人口”、“不到一秒钟的错误。”。
可以看出,图2中的每一行目标语言文本虽然与图1中的每一行源语言文本相对应,但是,图2所示的目标语言文本与图1的源语言文本的语义偏差较大,不仅影响翻译的准确率,而且为用户的理解增加了难度。
发明内容
本发明实施例提供一种翻译方法、装置和用于翻译的装置,可以提高用户查看商品信息的效率。
为了解决上述问题,本发明实施例公开了一种翻译方法,所述方法包括:
确定图像中的源语言文本行区域;
若确定相邻的源语言文本行区域中包括同一个段落的文本内容,则合并所述相邻的源语言文本行区域,以得到源语言文本段区域;
对所述源语言文本段区域中的源语言文本进行翻译,以得到所述源语言文本对应的目标语言文本。
另一方面,本发明实施例公开了一种翻译装置,所述装置包括:
确定模块,用于确定图像中的源语言文本行区域;
合并模块,用于若确定相邻的源语言文本行区域中包括同一个段落的文本内容,则合并所述相邻的源语言文本行区域,以得到源语言文本段区域;
翻译模块,用于对所述源语言文本段区域中的源语言文本进行翻译,以得到所述源语言文本对应的目标语言文本。
再一方面,本发明实施例公开了一种用于翻译的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定图像中的源语言文本行区域;
若确定相邻的源语言文本行区域中包括同一个段落的文本内容,则合并所述相邻的源语言文本行区域,以得到源语言文本段区域;
对所述源语言文本段区域中的源语言文本进行翻译,以得到所述源语言文本对应的目标语言文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于搜狗(杭州)智能科技有限公司;北京搜狗科技发展有限公司,未经搜狗(杭州)智能科技有限公司;北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910100754.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像拼接方法和装置
- 下一篇:一种基于用户数据生成标签的方法及装置