[发明专利]通用型垂直搜索引擎的行业应用模型建模方法在审
申请号: | 201010564470.2 | 申请日: | 2010-11-30 |
公开(公告)号: | CN102012922A | 公开(公告)日: | 2011-04-13 |
发明(设计)人: | 刘学明;钱宇;张康 | 申请(专利权)人: | 无锡快度信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 214043 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 通用型垂直搜索引擎的行业应用模型建模方法,垂直搜索核心模块Spider(1)访问行业应用模型(2)实现不同行业信息的识别、抓取、组织、存储和传输应用,行业应用模型(2)山Internet网页库(21)和网页存储分类索引管理组件(211)、网页结构信息模型库(22)和网页结构信息模型管理组件(221)、行业信息结构模型库(23)和行业信息结构模型管理组件(231)、行业信息存储模型库(24)和行业信息存储模型管理组件(241)、以及用户系统接口模型库(25)和用户系统接口模型管理组件(251)构成。本发明解决了一个模型中同时涵盖不同行业应用、不同网页、不同行业信息结构和存储结构问题,使得垂直搜索能够完成不同行业和不同结构互联网信息的识别、抓取、组织、存储和传输应用,从而具备通用型垂直搜索引擎的多行业应用能力。 | ||
搜索关键词: | 通用型 垂直 搜索引擎 行业 应用 模型 建模 方法 | ||
【主权项】:
通用型垂直搜索引擎的行业应用模型建模方法,其特征在于垂直搜索核心模块Spider(1)访问行业应用模型(2)实现不同行业信息的识别、抓取、组织、存储和传输应用,行业应用模型(2)由Internet网页库(21)和网页存储分类索引管理组件(211)、网页结构信息模型库(22)和网页结构信息模型管理组件(221)、行业信息结构模型库(23)和行业信息结构模型管理组件(231)、行业信息存储模型库(24)和行业信息存储模型管理组(241)、以及用户系统接口模型库(25)和用户系统接口模型管理组件(251)构成;其中:Internet网页库(21)和网页存储分类索引管理组件(211)承担Ihternet网页库(21)存储、分类和索引管理任务,其中网页存储分类索引管理组件(211)调用Google API(212)实现行业应用网页URL集合的搜索;网页结构信息模型库(22)和网页结构信息模型管理组件(221)承担网页结构的分析、描述、页面访问控制、页面转换链接控制、以及页面和行业应用关系的描述和管理任务;行业信息结构模型库(23)和行业信息结构模型管理组件(231),承担各种不同的行业信息在各个网页中不同的结构形态和网页位置的描述、提取、生成和管理任务;行业信息存储模型库(24)和行业信息存储模型管理组件(241),承担各种不同的行业信息从各网页抓取后在系统中的存储形态和存储结构的描述、存储结构的动态生成和管理任务;用户系统接口模型库(25)和用户系统接口模型管理组件(251),承担与各用户专用系统之间的信息存储形态及存储结构的转换关系、信息传输接口、以及软件接口关系形态、接口定义及调用的描述、生成和管理任务。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡快度信息技术有限公司,未经无锡快度信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010564470.2/,转载请声明来源钻瓜专利网。