[发明专利]电子文档的搜索方法及系统无效
申请号: | 200910041027.4 | 申请日: | 2009-07-10 |
公开(公告)号: | CN101599069A | 公开(公告)日: | 2009-12-09 |
发明(设计)人: | 王顼 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州华进联合专利商标代理有限公司 | 代理人: | 何 平;曾旻辉 |
地址: | 518044广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子 文档 搜索 方法 系统 | ||
1、一种电子文档的搜索方法,其特征在于,包括以下步骤:
抓取电子文档及所述电子文档的关联信息;
建立包含所述关联信息的电子文档的索引;
响应用户的搜索请求返回包含所述关联信息的搜索结果。
2、根据权利要求1所述的电子文档的搜索方法,其特征在于,所述建立包含所述关联信息的电子文档的索引的步骤包括:
判断是否已经为该电子文档建立索引;
如果未为该电子文档建立索引则为该电子文档建立索引;
如果已经为该电子文档建立索引则将所述关联信息追加存入索引中。
3、根据权利要求1或2所述的电子文档的搜索方法,其特征在于,所述建立包含所述关联信息的电子文档的索引的步骤包括:解析该电子文档的内容,并将所述电子文档的内容作为所述索引的一部分。
4、根据权利要求1或2所述的电子文档的搜索方法,其特征在于,所述建立包含所述关联信息的电子文档的索引的步骤包括:根据所述电子文档的链接地址建立唯一的电子文档编号,并根据所述电子文档编号组织所述索引。
5、根据权利要求1所述的电子文档的搜索方法,其特征在于,所述关联信息包括链接到该电子文档的链接文字信息或提供链接到该电子文档的链接的网页页面内容信息。
6、根据权利要求1所述的电子文档的搜索方法,其特征在于,所述关联信息包括用户对该电子文档的评价信息。
7、一种电子文档的搜索系统,其特征在于,包括:
数据抓取模块,用于抓取电子文档及所述电子文档的关联信息;
索引模块,与所述数据抓取模块相连建立包含所述关联信息的电子文档的索引;
存储模块,与所述索引模块相连以存储所述索引;
检索模块,与所述存储模块连接,响应用户的搜索请求返回包含所述关联信息的搜索结果。
8、根据权利要求7所述的电子文档的搜索系统,其特征在于,所述索引模块还用于查询所述存储模块判断是否已经为该电子文档建立索引,如果未为该电子文档建立索引则为该电子文档建立索引,如果已经为该电子文档建立索引则将所述关联信息追加存入索引中。
9、根据权利要求7或8所述的电子文档的搜索系统,其特征在于,还包括内容解析模块,所述内容解析模块与所述数据抓取模块相连以解析该电子文档的内容,所述索引模块与所述内容解析模块相连并将所述电子文档的内容作为所述索引的一部分。
10、根据权利要求7或8所述的电子文档的搜索系统,其特征在于,所述关联信息包括链接到该电子文档的链接文字信息、提供链接到该电子文档的链接的网页页面内容信息、用户对该电子文档的评价信息中的一种或两种以上。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910041027.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:在土地利用信息多尺度表达中的空间数据库综合方法
- 下一篇:流程处理方法和装置