[发明专利]文件目录的生成方法、装置、服务器及计算机存储介质有效
申请号: | 201710178381.6 | 申请日: | 2017-03-23 |
公开(公告)号: | CN106951540B | 公开(公告)日: | 2018-01-12 |
发明(设计)人: | 孙上斌 | 申请(专利权)人: | 掌阅科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/25 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙)11276 | 代理人: | 宋菲,刘云贵 |
地址: | 100124 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种文件目录的生成方法、装置、服务器及计算机存储介质。其中,方法包括对文件中除目录页以外的其他页面中的文本对象进行文字样式聚类处理,得到多个具有不同文字样式的文本对象集合;对文件的目录页进行分析,得到目录项文本;对于每个文本对象集合,将该文本对象集合中文本对象分别与目录项文本进行文字内容模糊匹配,根据模糊匹配结果,确定文本对象属于目录项的文本对象集合;将文本对象与该文本对象在文件中的文本偏移位置关联生成目录页。利用本发明提供的技术方案,能够提升目录的规范性和准确性,保证生成的目录页更为准确,从而使用户能够充分地利用目录定位到相应的文本对象,给予用户正确地引导。 | ||
搜索关键词: | 文件 目录 生成 方法 装置 服务器 计算机 存储 介质 | ||
【主权项】:
一种文件目录的生成方法,包括:对文件中除目录页以外的其他页面中的文本对象进行文字样式聚类处理,得到多个具有不同文字样式的文本对象集合;对文件的目录页进行分析,得到目录项文本;对于每个文本对象集合,将该文本对象集合中文本对象分别与目录项文本进行文字内容模糊匹配,根据模糊匹配结果,确定文本对象属于目录项的文本对象集合;将文本对象与该文本对象在文件中的文本偏移位置关联生成目录页。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于掌阅科技股份有限公司,未经掌阅科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710178381.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种月饼馅料的粉碎搅拌一体化设备
- 下一篇:一种水产饲料用粉碎装置