[发明专利]检测并重构固定格式文档中的东亚布局特征有效
申请号: | 201480026958.6 | 申请日: | 2014-02-28 |
公开(公告)号: | CN105247509B | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | D·扎里克;M·舍舒姆;M·拉扎里维克;M·拉斯科维克 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22;G06K9/00 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 王英 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 并重 固定 格式 文档 中的 东亚 布局 特征 | ||
提供了东亚布局特征的检测和东亚布局特征的重构。固定格式文档中的垂直书写的文本被检测并旋转以供布局分析。在布局分析之后,经旋转的文本被旋转回去并在流格式文档中重构。当多个字符水平地被书写在文本的垂直行中时,垂直重叠文本串被检测,并分派作为垂直中的水平文本,并被重建为流格式文档中的垂直中的水平文本。文本的行被分析以寻找ruby行的属性,并被分派作为与ruby基础行中的对应文本相关联的ruby文本,并在流格式文档中被重建为ruby文本。在固定格式文档中的文本被分析用于特定东亚语言的检测,使得该语言的字体在流格式文档中被指定。
流格式文档和固定格式文档被广泛使用且具有不同的目的。流格式文档使用诸如章节、段落、列和表之类的复杂逻辑格式化对象来组织文档。结果,流格式文档提供了灵活性且容易修改,使得它们适用于涉及被频繁更新或受到相当多编辑的文档的任务。相反,固定格式文档使用诸如文本串、路径和图像之类的基本物理布局元素来组织文档以保留原始外观。固定格式文档提供了一致且精确的格式布局,使得它们适用于涉及不被频繁或大量改变的或其中需要统一性的文档的任务。这样的任务的示例包括文档归档、高质量再现,以及用于商业发布和印刷的源文件。固定格式文档通常从流格式源文档中创建。固定格式文档还包括物理(即,纸质)文档的数字化再现(例如,扫描和照片)。
在其中需要编辑固定格式文档但流格式源文档不可用的情况下,固定格式文档可被转换成流格式文档。转换涉及解析该固定格式文档并将来自固定格式文档的基本物理布局元素变换成在流格式文档中使用的更复杂的逻辑元素。
许多东亚语言可以是横排或竖排书写的。例如,中文、日文和韩文手稿(有时被称为CJK手稿)可以在水平或垂直方向朝向。在某些情况中,垂直写的文本可包括垂直中的水平文本,其中多个字符可水平地显示在为一个垂直字符保留的区域中。当前,当将具有垂直文本的固定格式文档转换到流格式文档时,包括垂直中的水平文本的垂直书写的文本可能不被识别,并且因此不能被正确地重构。
此外,在水平和垂直书写的东亚手稿中,包括指示单词的发音的字符的阅读帮助,在此称为ruby文本,可被包括。在水平文本中,ruby文本可置于文本行之上,而在垂直文本中,ruby文本可置于文本行之右。当前,当将固定格式文档转换到流格式文档时,ruby文本可被识别为常规文本流并且不能被正确重构并与对应基础文本相关联。
此外,各种东亚语音共享Unicode(统一代码)值的一范围,其图形表示可依赖于正被使用的特定字体。因此,当重建以东亚语言(例如,中文、日文、或韩文)书写的文档时,特定语言的确定可被执行以提供针对该语言的合适字体。
本发明正是对于这些和其他考虑事项而作出的。
提供本发明内容以便以简化的形式介绍将在以下详细描述中进一步描述的一些概念。本概述并不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。
本发明的各实施例通过提供固定格式文档中的垂直文本的检测并在将固定格式文档转换成流格式文档时重建垂直文本来解决以上和其他问题。
本发明的各实施例通过提供固定格式文档中的ruby文本的检测并在将固定格式文档转换成流格式文档时重建ruby文本来解决以上和其他问题。
本发明的各实施例通过提供固定格式文档中的垂直中的水平文本的检测并在将固定格式文档转换成流格式文档时重建垂直中的水平文本来解决以上和其他问题。
本发明的各实施例通过提供固定格式文档中的特定东亚语言的检测并在将固定格式文档转换成流格式文档时重建特定东亚语言来解决以上和其他问题。
一个或多个实施例的细节在附图和以下描述中被阐明。通过阅读下面的详细描述并参考相关联的附图,其他特征和优点将变得显而易见。要理解的是下面的详细描述仅仅是解释性的,而不是对所要求保护的发明的限制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480026958.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:压罐器槽式底板的制造工艺
- 下一篇:专用异形扳手制造工艺