[发明专利]关键字自动超级链接的方法有效
申请号: | 201510946128.1 | 申请日: | 2015-12-16 |
公开(公告)号: | CN105574162B | 公开(公告)日: | 2019-05-03 |
发明(设计)人: | 吴阳;杜宇 | 申请(专利权)人: | 南京鼎岩信息科技有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955 |
代理公司: | 南京钟山专利代理有限公司 32252 | 代理人: | 戴朝荣 |
地址: | 210000 江苏省南京市鼓楼区幕府*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种关键字自动超级链接的方法,用户打开应用程序时,程序根据当前的配置判断是否需要从指定的服务器下载关键字超链数据,如果需要下载,则自动从指定的服务器下载并保存到本地;用户在通过应用程序打开文档时,应用程序解析文档时自动分析关键字,并在关键字超链数据库中搜索匹配关键字,获取对应的超链数据;如果在数据库没有匹配到关键字,则访问指定的服务器,以此来获取指定关键字的超级链接数据,并更新到本地,如果在数据库能够匹配到关键字,根据匹配关键字获取的超级链接数据,在展示文档内容时,在关键字区域展示超级链接。避免了超级链接还无法在远程通过关键词实现自动形成超链的形式而由此极大的局限了它的作用效果的问题。 | ||
搜索关键词: | 关键字 自动 超级链接 方法 | ||
【主权项】:
1.一种关键字自动超级链接的方法,其特征在于:用户打开应用程序时,程序根据当前的配置判断是否需要从指定的服务器下载关键字超链数据,如果需要下载,则自动从指定的服务器下载并保存到本地;用户在通过应用程序打开文档时,应用程序解析文档时自动分析关键字,并在关键字超链数据库中搜索匹配关键字,获取对应的超链数据;如果在数据库没有匹配到关键字,则访问指定的服务器,以此来获取指定关键字的超级链接数据,并更新到本地,如果在数据库能够匹配到关键字,根据匹配关键字获取的超级链接数据,在展示文档内容时,在关键字区域展示超级链接;其中,在所述的应用程序解析文档的方式为:先进行单个文档样本数据收集,也就是根据用户打开的文档进行分析,样本数据先保存在本地,待用户连网之后再把这些数据上传给服务器来完成关键字的提取、分类、权重调整和超链数据的准备;记录样本数据时需要记录文档最近一次打开的时间以及上传之前打开的次数,这两项信息是之后计算关键字权值时需要的;所述的样本数据的存储格式依次为存储数据包大小、最后打开时间、打开次数、文档语言、文件名称长度、文件名称数据、文档标题长度、文档标题数据、首段内容长度、首段内容数据、末段内容长度、末段内容数据、书签条目数量、第一书签条目长度、第一书签条目内容、第二书签条目长度、第二书签条目内容…第n书签条目长度、第n书签条目内容、随机内容数量、第一随机内容长度、第一随机内容数据、第二随机内容长度、第二随机内容数据…第n随机内容长度、第n随机内容数据的数据段;其中n为正整数;在对随机内容进行抽取时,能够采用随机抽取算法或分层抽取法进行抽取;所述的随机抽取算法要随机读取整个文档的内容,该算法具体流程如下,首先确定需要抽取的样本的数量,根据文档内容的大小,生成一组样本数量的随机数列表且不重复,再依照该数列表组中各数值作为文档内偏移,依次读取固定长度的文本内容并保存;所述的分层抽取算法具体流程如下,首先确定需要抽取的样本的数量N,第一层需要抽取的样本数量为总数量的N/H;如果该文档有书签信息,则以书签信息作为第一层样本池,如果没有书签信息,则以分页信息作为第一层样本池;以各书签ID或各分页ID号来构造列表,再以书签的数量或分页数量为基数构造需要的第一层样本列表;接下来根据抽取的第一层样本列表,各自单独抽取H个样本;如果是以书签信息作为样本池的,根据已生成的第一层样本列表,每个表项都是一个书签ID,在单独抽取二层样本的时候,根据书签ID来定位文档的位置,再用随机抽取算法抽取H个文本样本数据开保存;而进行样本数据上传及关键字信息提取的方式为:样本数据会根据用户打开不同的文档进行更新,存储在本地设备中;在用户设备联网的时候,根据策略设置上传本地存储的样本数据到服务器上,以便进行关键字提取及后续工作;在进行客户端ID计算和校验时,其方法包括硬件组合ID的方法或者客户唯一信息的方法,也能够是几种方法的组合;进行关键字提取是用关键字提取算法进行提取的,也就是用户样本数据上传到服务器之后,服务器端就根据这些数据进行关键字提取;对关键字的提取之后,再进一步总结出所属范畴的前几名列表;在进行关键字数据累积、权重调整时,关键字及范畴即可做为用户的标签数据,这些标签数据也会有不同权重,依此来调整超链数据的推送的优先级,标签数据权值的跟关键字命中的时间,命中次数这样的参数相关,原则是,越是近期命中的关键字其标签权值越大,命中次数越多权值越大;在执行关键字及超链数据推送时,软件打开的时候根据联网的状态判断是否需要从服务更新关键字超链数据,具体规则和上传样本数据的规则一致;从服务器下载超链数据时需要提供软件客户端ID信息,服务器会根据跟ID找到关键字超链数据并返回相关数据大小这样的信息,供软件下载;下载的数据格式具体说来,依次为大小、标签数量、权值、关键字数量、关键字列表、超链数据、标签数据的数据段;下载的数据保存在本地设备中,当用户打开文档时,软件分析文档内容,匹配上述数据的各标签中关键字列表,优先匹配权值比较高的标签,匹配上后则关联文档中关键字和超链数据,在展示文档的时候根据策略展示超链内容。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京鼎岩信息科技有限公司,未经南京鼎岩信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510946128.1/,转载请声明来源钻瓜专利网。
- 上一篇:路局线路拓扑图的存储方法
- 下一篇:一种照片存储方法及设备