[发明专利]一种翻译图片中文字的方法有效
申请号: | 201610073785.4 | 申请日: | 2016-02-02 |
公开(公告)号: | CN105761201B | 公开(公告)日: | 2019-03-22 |
发明(设计)人: | 王洪君;孙健琳;于光玉;刘珂;王小飞 | 申请(专利权)人: | 山东大学 |
主分类号: | G06T3/00 | 分类号: | G06T3/00;G06K9/32;G06K9/34;G06K9/62;G06F17/28 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 吕利敏 |
地址: | 250199 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种翻译图片中文字的方法。本发明所述种翻译图片中文字的方法,仅对文档中文字部分使用机器学习的方法进行检测和OCR识别;可对文字部分先进行机器翻译并设置相应翻译准确的置信度,后期进行人工翻译调整,并将不同翻译准确率置信度的翻译用不同的背景色标记区分,提高了翻译准确度。本发明所述种翻译图片中文字的方法,提出了一种保留原有扫描文件图片格式,仅通过识别图片中文字区域和内容可进行多种翻译方式的选择,翻译准确度高,易操作和实现。 | ||
搜索关键词: | 一种 翻译 图片 文字 方法 | ||
【主权项】:
1.一种翻译图片中文字的方法,其特征在于,包括步骤如下:1)图片的预处理:对图片进行去噪、文字内容对齐和对比度调整;2)文字区域检测:采用机器学习的方法生成的检测器检测并标记图片中的文字区域和非文字区域:模型训练:通过文字区域样本和非文字区域样本训练生成检测器;区域检测:通过所述检测器确定图片中的文字区域;3)文字区域识别:使用OCR识别所述文字区域内的文字内容并保存,同时将文字区域用背景色覆盖,设置为可编辑区域;4)文本翻译:对已识别出的文字依次进行机器翻译和人工翻译,并对不同人工对应的人工翻译设置翻译准确率置信度;不同的翻译准确率置信度对应不同的背景颜色;用机器翻译对应的背景颜色替代所述背景色;如果人工翻译对应的翻译准确率置信度高于机器翻译对应的翻译准确率置信度,则用人工翻译的结果代替机器翻译的结果,并用人工翻译对应置信度的背景颜色替代机器翻译对应置信度的背景颜色;如果人工翻译对应的翻译准确率置信度低于机器翻译对应的翻译准确率置信度,则重新选择人工翻译,直至人工翻译对应的翻译准确率置信度高于机器翻译对应的翻译准确率置信度,用人工翻译的结果代替机器翻译的结果,并用人工翻译对应置信度的背景颜色替代机器翻译对应置信度的背景颜色;5)文字区域调整:根据文字区域对翻译的结果进行排版调整,文本翻译结束后,统计翻译后文本的字数;根据文本区域大小,确定新的文字大小标准:计算翻译后文本中单个文字的字宽、字高及字间距;按照新的文字大小标准将翻译后文本填充至文本区域;6)文本翻译输出:将翻译好的文字区域与原图片的排版和格式合并后保存输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610073785.4/,转载请声明来源钻瓜专利网。
- 上一篇:点云拼接方法及系统
- 下一篇:用于纹理处理的方法、设备、模拟器和电子设备