[发明专利]基于相关词语语义分析的全文检索系统有效
申请号: | 201410061245.5 | 申请日: | 2014-02-24 |
公开(公告)号: | CN103838833B | 公开(公告)日: | 2017-03-15 |
发明(设计)人: | 张茂元;邹春燕;陈水银;张红;管益龙;贺凡黎;华丽君;罗贤亮;吴德钰;袁芳;孟琼瑶 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 武汉天力专利事务所42208 | 代理人: | 吴晓颖 |
地址: | 430079 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于信息检索技术,提供一种基于相关词语语义分析的全文检索系统,包括查询信息接收模块、基于相关词语的概念语义分析模块、语义知识库模块、检索模块、索引库、索引模块、基于相关词语的主题语义分析模块、结果集处理模块和数据服务器。本发明系统是对传统互联网搜索引擎的改进,能够对文档进行基于相关词语的概念语义分析和基于相关词语的主题语义分析,从而使用户可得到更准确、更全面、更智能化的查询结果。 | ||
搜索关键词: | 基于 相关 词语 语义 分析 全文 检索系统 | ||
【主权项】:
基于相关词语语义分析的全文检索系统,包括查询信息接收模块、基于相关词语的概念语义分析模块、语义知识库模块、检索模块、索引库、索引模块、基于相关词语的主题语义分析模块、结果集处理模块和数据服务器;所述查询信息接收模块用于接收用户输入的查询语句,对查询语句进行中文分词和去停用词处理之后,将其提交给基于相关词语的概念语义分析模块并且提交给检索模块进行检索服务;所述基于相关词语的概念语义分析模块采用基于相关词语的概念语义分析方法,得到词语之间的语义相关量化关系,并提交给语义知识库模块;然后基于相关词语的概念语义分析模块将从语义知识库模块得到的相关词及其贡献度作为基于相关词语的主题语义分析模块的输入;所述语义知识库模块用来存储词语及其相关词群和贡献度信息,从查询信息接收模块中得到用户输入的查询词,在语义知识库中检索,将查询词对应的相关词群及贡献度返回给基于相关词语的概念语义分析模块;所述检索模块为用户提供检索服务,检索模块负责接收查询信息接收模块的指令,将查询语句提交给索引库进行查询匹配,返回所有与查询语句匹配的文档信息,并对检索结果集进行排序处理,将排序后的结果集提交给结果集处理模块;所述索引库用来存储由索引模块对文档建立的索引,索引库还根据检索模块提交的查询请求在索引中快速检索,并将结果返回给检索模块;所述索引模块用来接收数据服务器提供的文档,对文档内容,标题和自定义信息进行中文分词和去停用词处理得到索引词,利用索引词和文档相关信息建立索引;所述基于相关词语的主题语义分析模块采用基于相关词语的主题语义分析方法,通过对文档进行主题语义分析,得到每个词与文档之间的语义相关量化关系,即对文档主题的贡献度,最后把这些运用到检索中提高搜索引擎的检索效果;所述结果集处理模块用于接收来自检索模块的结果集,并根据索引库的信息建立结果集的文摘信息和快照信息,并对返回结果进行反显、回显和分页处理;所述数据服务器用于存储知识数据词典、文档集,为基于相关词语的概念语义分析模块提供数据资源和管理服务,为基于相关词语的主题语义分析模块和索引模块提供文档集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410061245.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种烟道臭氧分布器、其布置方式及应用
- 下一篇:一种模型飞机