[发明专利]数字出版物导览目录处理方法和装置有效
申请号: | 201410203649.3 | 申请日: | 2014-05-14 |
公开(公告)号: | CN105095285B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 杨雷鸣;王婷 | 申请(专利权)人: | 北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | G06F16/904 | 分类号: | G06F16/904 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘芳 |
地址: | 100871 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数字 出版物 目录 处理 方法 装置 | ||
1.一种数字出版物导览目录处理方法,其特征在于,包括:
在指定页码范围内的文字内容中确定候选主题集合;
分别计算所述候选主题集合中每个主题的权重,将最大权重值对应的主题确定为所述指定页码范围内的文字内容的主题;
根据所述确定的主题,分别计算所述指定页码范围内的每一图片的权重,将最大权重值对应的图片确定为与所述确定的主题匹配的图片;
将所述指定页码范围和所述确定的主题以及对应的图片生成所述数字出版物导览目录;
其中,根据所述确定的主题,分别计算所述指定页码范围内的每一图片的权重,包括:
根据公式:分别计算所述指定页码范围内的每一图片的权重,其中,H表示图片高度,W表示图片宽度,S表示图片的边界与所述确定的主题之间的最近距离,单位为毫米。
2.根据权利要求1所述的方法,其特征在于,所述分别计算所述候选主题集合中每个主题的权重,包括:
根据公式:分别计算所述候选主题集合中每个主题的权重,其中,N为主题的字数。
3.根据权利要求1所述的方法,其特征在于,所述分别计算所述候选主题集合中每个主题的权重,包括:
根据公式R2=L2,分别计算所述候选主题集合中每个主题的权重,其中,L为主题的字号高度。
4.根据权利要求2所述的方法,其特征在于,所述分别计算所述候选主题集合中每个主题的权重,包括:
根据公式:分别计算所述候选主题集合中每个主题的权重,N为主题的字数,L为主题的字号高度。
5.根据权利要求1-4任一项所述的方法,其特征在于,将所述指定页码范围和所述确定的主题以及对应的图片生成所述数字出版物导览目录之后包括:
显示所述数字出版物导览目录。
6.一种数字出版物导览目录处理装置,其特征在于,包括:
第一确定模块,用于在指定页码范围内的文字内容中确定候选主题集合;
第一计算模块,用于分别计算所述第一确定模块确定的候选主题集合中每个主题的权重;
第二确定模块,用于将所述第一计算模块计算的最大权重值对应的主题确定为所述指定页码范围内的文字内容的主题;
第二计算模块,用于根据所述第二确定模块确定的主题,分别计算所述指定页码范围内的每一图片的权重;
第三确定模块,用于将所述第二计算模块计算的最大权重值对应的图片确定为与所述确定的主题匹配的图片;
生成模块,用于将所述指定页码范围和所述第二确定模块确定的主题以及第三确定模块确定的图片生成所述数字出版物导览目录;
其中,所述第二计算模块,用于根据公式:分别计算所述指定页码范围内的每一图片的权重,其中,H表示图片高度,W表示图片宽度,S表示图片的边界与所述确定的主题之间的最近距离,单位为毫米。
7.根据权利要求6所述的装置,其特征在于:
所述第一计算模块,用于根据公式:分别计算所述候选主题集合中每个主题的权重,其中,N为主题的字数。
8.根据权利要求6所述的装置,其特征在于:
所述第一计算模块,还用于根据公式R2=L2,分别计算所述候选主题集合中每个主题的权重,其中,L为主题的字号高度。
9.根据权利要求7所述的装置,其特征在于:
所述第一计算模块,还用于根据公式:分别计算所述候选主题集合中每个主题的权重,N为主题的字数,L为主题的字号高度。
10.根据权利要求6-9任一项所述的装置,其特征在于,还包括:
显示模块,用于显示所述生成模块生成的数字出版物导览目录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京北大方正电子有限公司,未经北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410203649.3/1.html,转载请声明来源钻瓜专利网。