[发明专利]有利于提高检索精度的系统在审
申请号: | 201711297042.6 | 申请日: | 2017-12-08 |
公开(公告)号: | CN108021681A | 公开(公告)日: | 2018-05-11 |
发明(设计)人: | 徐娇 | 申请(专利权)人: | 成都谷问信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 成都路航知识产权代理有限公司 51256 | 代理人: | 李凌 |
地址: | 610000 四川省成都市高*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 有利于 提高 检索 精度 系统 | ||
本发明公开了有利于提高检索精度的系统,包括:用于将需要检索的文字划分为多个词语的划分模块;用于得出所有词语出现的频率,并选出出现频率最高的词语作为高频词的选取模块;用于选出与高频词相关的词语的相关模块;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;用于将高频词和相关的词语作为检索词进行检索的检索模块。本发明有利于提高检索精度的系统,通过智能语意的方式对词汇进行筛选,事先了检索的智能化,可以有效的节省人力成本。
技术领域
本发明涉及计算机技术领域,具体涉及有利于提高检索精度的系统。
背景技术
在网络时代,我们无时无刻地进行着检索。在因特网上进行检索主要有两种方式:目录浏览和使用搜索引擎。目录浏览的方式即搜索引擎采用的方式,用户可以根据自己的需要点击目录,深入下一层子目录,从而找到自己需要的信息。这种方式便于查找某一类的信息集合,但是精确定位的能力不强。搜索引擎是目前最为常用的一种网络检索工具。用户只需要提交自己的需求,搜索引擎就能返回大量结果。这些结果按照和检索提问的相关性进行排序。除了搜索引擎之外,图书馆订购的各种数据库也是信息检索的重要途径。美国国会图书馆参考咨询馆员托马斯·曼就介绍了关键词检索、引文检索、相关性检索等检索方法。
目前的检索往往都采用人工的方式进行检索,而随着文件数据量的增大,人工检索需要的工作量会以几何倍上升,极大的提高了检索工作的人力成本。
发明内容
本发明所要解决的技术问题是目前的检索往往都采用人工的方式进行检索,而随着文件数据量的增大,人工检索需要的工作量会以几何倍上升,极大的提高了检索工作的人力成本,目的在于提供有利于提高检索精度的系统,解决上述问题。
本发明通过下述技术方案实现:
有利于提高检索精度的系统,包括:用于将需要检索的文字划分为多个词语的划分模块;用于得出所有词语出现的频率,并选出出现频率最高的词语作为高频词的选取模块;用于选出与高频词相关的词语的相关模块;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;用于将高频词和相关的词语作为检索词进行检索的检索模块。
现有技术中,检索往往都采用人工的方式进行检索,而随着文件数据量的增大,人工检索需要的工作量会以几何倍上升,极大的提高了检索工作的人力成本。本发明应用时,先将需要检索的文字划分为多个词语;再得出所有词语出现的频率,并选出出现频率最高的词语作为高频词;然后选出与高频词相关的词语;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;再然后将高频词和相关的词语作为检索词进行检索。由于通过智能语意的方式对词汇进行筛选,事先了检索的智能化,可以有效的节省人力成本。
进一步的,所述划分模块通过语意树将需要检索的文字划分为多个词语。
进一步的,当出现频率最高的词语为两个及以上时,所述选取模块将两个及以上词语都作为高频词。
进一步的,所述词语的字节数不超过10个。
进一步的,所述高频词的出现频率为两次及以上。
本发明与现有技术相比,具有如下的优点和有益效果:
本发明有利于提高检索精度的系统,通过智能语意的方式对词汇进行筛选,事先了检索的智能化,可以有效的节省人力成本。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本发明系统结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都谷问信息技术有限公司,未经成都谷问信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711297042.6/2.html,转载请声明来源钻瓜专利网。