[发明专利]一种面向纺织原料基于语义的数据搜索引擎无效
申请号: | 201010160377.5 | 申请日: | 2010-04-30 |
公开(公告)号: | CN101937444A | 公开(公告)日: | 2011-01-05 |
发明(设计)人: | 吕瑞宝;闫红桥;沈霞锋 | 申请(专利权)人: | 绍兴易企信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 绍兴市越兴专利事务所 33220 | 代理人: | 蒋卫东 |
地址: | 312025 浙江省绍兴*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 纺织 原料 基于 语义 数据 搜索引擎 | ||
1.一种面向纺织原料基于语义的数据搜索引擎装置,其特征在于:包括三大部份:客户端操作界面,基于语义的搜索引擎,市场行为数据仓库。
2.一种面向纺织原料基于语义的数据搜索引擎方法,其特征在于,包括以下步骤:
(1)、从元数据文档存储区读取文档信息;
(2)、利用筛选器过滤元数据文档中的格式信息和非文字信息,生成文字串和属性/值对,并把它传递给索引引擎;
(3)、对提取的字符串进行反向索引:即记录包含搜索词的文档的信息、出现次数以及搜索闻在文档中的相关位置;就是说将习惯思维的对应关系:“文件号”对“文件中所有关键词”,利用倒排索引把这个关系倒过来,变成:“关键词”对“拥有该关键同的所有文件号”,即某个查询词在某些文件中出现过;反向索引可以应用统计和概率公式,以便快速计算文档的相关性;
(4)、根据搜索词对搜索到的元数据集按照特定算法进行排序,把最相关的文档放在最前面,提高搜索的准确性:经过对轻纺原料数据库共享数据进行长期的分析总结,项目内部制定自己的数据权重分析方法,采用的排序算法以此为基础,并结合搜索引擎排序算法常用的PageRank,也就是链接分析算法得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于绍兴易企信息科技有限公司,未经绍兴易企信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010160377.5/1.html,转载请声明来源钻瓜专利网。