[发明专利]数字出版物导览目录处理方法和装置有效
申请号: | 201410203649.3 | 申请日: | 2014-05-14 |
公开(公告)号: | CN105095285B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 杨雷鸣;王婷 | 申请(专利权)人: | 北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | G06F16/904 | 分类号: | G06F16/904 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘芳 |
地址: | 100871 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数字 出版物 目录 处理 方法 装置 | ||
本发明提供一种数字出版物导览目录处理方法和装置,通过在指定页码范围内的文字内容中确定候选主题集合;分别计算所述候选主题集合中每个主题的权重,将最大权重值对应的主题确定为所述指定页码范围内的文字内容的主题;根据所述确定的主题,分别计算所述指定页码范围内的每一图片的权重,将最大权重值对应的图片确定为与所述确定的主题匹配的图片;将所述指定页码范围和所述确定的主题以及对应的图片生成所述数字出版物导览目录。可以根据指定页码范围内的文字内容自动生成数字出版物导览目录,提高了数字出版物导览目录处理效率,可以解决现有的数字出版物导览目录处理效率低的问题。
技术领域
本发明涉及数字出版技术,尤其涉及一种数字出版物导览目录处理方法和装置。
背景技术
随着平板电脑及智能手机的普及,数字出版成为一种重要的出版形式。数字出版以电子设备为阅读载体、通过互联网进行传播。具有节约纸张,传播方便迅速,具有丰富的多媒体效果等特性,必将成为未来主要的出版形式。这里的数字出版物不仅仅限于电子书,可以涵盖数字报、数字杂志、电子书、数字教材、教学课件等。
数字出版物由于不存在印刷成本,因此版面以彩色为主、图片居多,版面效果丰富,版式没有明显的规律性,导览目录具有页面跳转能力。因此传统的印刷出版提取目录的方法不再适用数字出版物导览目录的提取。由于数字出版目前处于起步阶段,成熟的数字出版物制作工具不多。现有的数字出版物制作工具导览目录以手工制作为主,存在效率低的问题。
发明内容
本发明提供一种数字出版物导览目录处理方法和装置,用以解决现有的数字出版物导览目录处理效率低的问题。
本发明提供一种数字出版物导览目录处理方法,包括:
在指定页码范围内的文字内容中确定候选主题集合;
分别计算所述候选主题集合中每个主题的权重,将最大权重值对应的主题确定为所述指定页码范围内的文字内容的主题;
根据所述确定的主题,分别计算所述指定页码范围内的每一图片的权重,将最大权重值对应的图片确定为与所述确定的主题匹配的图片;
将所述指定页码范围和所述确定的主题以及对应的图片生成所述数字出版物导览目录。
本发明提供一种数字出版物导览目录处理装置,包括:
第一确定模块,用于在指定页码范围内的文字内容中确定候选主题集合;
第一计算模块,用于分别计算所述第一确定模块确定的候选主题集合中每个主题的权重;
第二确定模块,用于将所述第一计算模块计算的最大权重值对应的主题确定为所述指定页码范围内的文字内容的主题;
第二计算模块,用于根据所述第二确定模块确定的主题,分别计算所述指定页码范围内的每一图片的权重;
第三确定模块,用于将所述第二计算模块计算的最大权重值对应的图片确定为与所述确定的主题匹配的图片;
生成模块,用于将所述指定页码范围和所述第二确定模块确定的主题以及第三确定模块确定的图片生成所述数字出版物导览目录。
本发明通过在指定页码范围内的文字内容中确定候选主题集合;分别计算所述候选主题集合中每个主题的权重,将最大权重值对应的主题确定为所述指定页码范围内的文字内容的主题;根据所述确定的主题,分别计算所述指定页码范围内的每一图片的权重,将最大权重值对应的图片确定为与所述确定的主题匹配的图片;将所述指定页码范围和所述确定的主题以及对应的图片生成所述数字出版物导览目录。可以根据指定页码范围内的文字内容自动生成数字出版物导览目录,提高了数字出版物导览目录处理效率,可以解决现有的数字出版物导览目录处理效率低的问题。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京北大方正电子有限公司,未经北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410203649.3/2.html,转载请声明来源钻瓜专利网。