[发明专利]基于层次式索引的版式可回流文件建立和绘制方法有效
申请号: | 201310188492.7 | 申请日: | 2013-05-21 |
公开(公告)号: | CN103268340A | 公开(公告)日: | 2013-08-28 |
发明(设计)人: | 龚如宾 | 申请(专利权)人: | 龚如宾 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/21 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 吴宝根 |
地址: | 200129 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于层次式索引的版式可回流文件建立和绘制方法,提出的统一注释技术,通过记录可回流文字的包围框,文本行或文本列参数,区域包围框等来描述版式文件的几何结构,同时赋予每个描述的几何结构一个索引号;为了描述句﹑段落﹑节和章等版式文件中包含的逻辑结构,给每个逻辑结构也赋予一个索引号。这样通过使用几何结构的索引号或逻辑结构的索引号来描述版式文件的逻辑结构和各结构间的阅读优先顺序。实现使用XML语言、SGML语言等标记语言来表示层次式索引结构。各种版式文件都可通过本发明方法来对版式数字书籍进行注释,减少记录容量。通过解析版式数字书籍逻辑结构,将能够使用相同的阅读程序来阅读不同格式的版式数字书籍。 | ||
搜索关键词: | 基于 层次 索引 版式 回流 文件 建立 绘制 方法 | ||
【主权项】:
一种基于层次式索引的版式可回流文件的建立和绘制方法,其特征在于,具体包括如下步骤:基于层次式索引的版式可回流文件建立:1)通过扫描、成像设备或者软件工具得到版式数字书籍页面数据;2)对每张数字书籍页面进行几何版面分析,得到文字段落区域和非文字区域,为每个区域分配一个索引号;对于非文字区域,计算其包围框,包围框形状可为长方形、圆、曲线、椭圆、三角形或者多边形形状,并记录对象包围框坐标或其所包围区域;3)对每个文本段落区域,确定其所包含的行或列,记录行对准线和列对准线,并为每一行或每一列分配一个索引号,此处索引号码的分配按照事先约定的规则来分配;4)对于其中每行,计算行内可回流对象的包围框,对每列,计算列内可回流对象的包围框,并为文字短路区域中的每个可回流对象计算出一个包围框,并记录可回流对象包围框坐标,并为每个可回流对象包围框分配一个索引号,确保行内或列内每个可回流几何区域有一个索引号码;5)利用版面相关的领域知识,对单张或多张数字书籍页面进行版面识别和理解,得到章,节,标题,子标题,摘要,作者版面逻辑区域信息;6)为每个逻辑区域分配索引号;其中每个逻辑区域包含一个或多个区域,通过记录其所包含区域的索引号来表达区域间的包含关系和从属关系,根据各区域的索引号或索引号码的组合来计算区域间的阅读顺序;对层次式索引的版式可回流文件进行绘制:7)通过网络或者本地存储介质得到版式文件和其层次式索引描述,解析此层次式索引描述;8)根据输出媒体尺寸和需要绘制的样式读入当前绘制需要的版面数据和对应的层次式索引描述数据,包括逻辑区域和几何区域数据;9)如果绘制对象区域是非文字区域类型,则根据输出媒体尺寸通过放大或缩小来进行绘制;10)如果绘制对象区域属于文字类型,则根据需要绘制的样式,能够绘制的行宽和列高,字包围区域大小或单词包围区域大小来计算每个区域在行内的横向偏移或列内的纵向偏移; 11)计算每个包围区域相对于每条行对准线或列对准线的旋转;12)根据计算好的包围区域的位置和旋转来绘制对应的包围区域。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于龚如宾,未经龚如宾许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310188492.7/,转载请声明来源钻瓜专利网。