[发明专利]一种文本检索方法和装置有效

专利信息
申请号: 201410101286.2 申请日: 2014-03-18
公开(公告)号: CN103886063B 公开(公告)日: 2017-03-08
发明(设计)人: 杨芳;盛兴;李蔚君;彭珍;赵鹏;贾辉辉;张同乔 申请(专利权)人: 国家电网公司;国家电网公司信息通信分公司;保定市大为计算机软件开发有限公司;国网山东省电力公司济南供电公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京集佳知识产权代理有限公司11227 代理人: 王宝筠
地址: 100031 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明实施例提供一种文本检索方法和装置,其中一种文本检索方法,包括获取用户输入的原始文本;从原始文本中获取检索词;依据用户的检索需求,对检索词进行过滤,得到关键词;对关键词进行组合,并依据组合后的关键词对文本数据库中的文本进行检索,得到至少一个检索文本;对检索文本以相关性倒序显示,并在检索文本中突显关键词,相关性用于原始文本和检索文本具有关联关系的程度。由于关键词是依据用户的检索需求对检索词进行过滤,所以关键词为无效词的几率降低,并且相比于直接从原始文本得到的检索词更符合检索需求,进而应用组合后的关键词检索得到的检索文本也比较符合检索需求,提高检索的准确度。
搜索关键词: 一种 文本 检索 方法 装置
【主权项】:
一种文本检索方法,其特征在于,包括:获取用户输入的原始文本;从所述原始文本中获取检索词,所述检索词用于检索文本数据库中的其他文本,以从文本数据库中获取符合用户的检索需求的文本;依据用户的检索需求,对所述检索词进行过滤,得到关键词;对所述关键词进行组合,并依据组合后的关键词对所述文本数据库中的文本进行检索,得到至少一个检索文本;对所述检索文本以相关性倒序显示,并在所述检索文本中突显所述关键词,所述相关性用于所述原始文本和所述检索文本具有关联关系的程度;其中,从所述原始文本中获取检索词,包括:使用中文分词方法对所述原始文本进行分词,得到一级检索词;依据词语特性,采用加权公式Wi=A×Freqi+B×Lengthi+C×Posi+D×Addi计算所述一级检索词的权重,所述词语特性包括词频Freqi、词长Lengthi、词性Posi和位置Addi,Wi为一级检索词i在文本中的权重,A、B、C、D为比例系数,用于表示各个词语特性在加权公式中的比重;提取所述权重在预设权重范围内的所述一级检索词,所提取出的所述一级检索词为所述检索词。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网公司;国家电网公司信息通信分公司;保定市大为计算机软件开发有限公司;国网山东省电力公司济南供电公司,未经国家电网公司;国家电网公司信息通信分公司;保定市大为计算机软件开发有限公司;国网山东省电力公司济南供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410101286.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top