[发明专利]一种文本检索方法和装置有效
申请号: | 201410101286.2 | 申请日: | 2014-03-18 |
公开(公告)号: | CN103886063B | 公开(公告)日: | 2017-03-08 |
发明(设计)人: | 杨芳;盛兴;李蔚君;彭珍;赵鹏;贾辉辉;张同乔 | 申请(专利权)人: | 国家电网公司;国家电网公司信息通信分公司;保定市大为计算机软件开发有限公司;国网山东省电力公司济南供电公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 王宝筠 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供一种文本检索方法和装置,其中一种文本检索方法,包括获取用户输入的原始文本;从原始文本中获取检索词;依据用户的检索需求,对检索词进行过滤,得到关键词;对关键词进行组合,并依据组合后的关键词对文本数据库中的文本进行检索,得到至少一个检索文本;对检索文本以相关性倒序显示,并在检索文本中突显关键词,相关性用于原始文本和检索文本具有关联关系的程度。由于关键词是依据用户的检索需求对检索词进行过滤,所以关键词为无效词的几率降低,并且相比于直接从原始文本得到的检索词更符合检索需求,进而应用组合后的关键词检索得到的检索文本也比较符合检索需求,提高检索的准确度。 | ||
搜索关键词: | 一种 文本 检索 方法 装置 | ||
【主权项】:
一种文本检索方法,其特征在于,包括:获取用户输入的原始文本;从所述原始文本中获取检索词,所述检索词用于检索文本数据库中的其他文本,以从文本数据库中获取符合用户的检索需求的文本;依据用户的检索需求,对所述检索词进行过滤,得到关键词;对所述关键词进行组合,并依据组合后的关键词对所述文本数据库中的文本进行检索,得到至少一个检索文本;对所述检索文本以相关性倒序显示,并在所述检索文本中突显所述关键词,所述相关性用于所述原始文本和所述检索文本具有关联关系的程度;其中,从所述原始文本中获取检索词,包括:使用中文分词方法对所述原始文本进行分词,得到一级检索词;依据词语特性,采用加权公式Wi=A×Freqi+B×Lengthi+C×Posi+D×Addi计算所述一级检索词的权重,所述词语特性包括词频Freqi、词长Lengthi、词性Posi和位置Addi,Wi为一级检索词i在文本中的权重,A、B、C、D为比例系数,用于表示各个词语特性在加权公式中的比重;提取所述权重在预设权重范围内的所述一级检索词,所提取出的所述一级检索词为所述检索词。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网公司;国家电网公司信息通信分公司;保定市大为计算机软件开发有限公司;国网山东省电力公司济南供电公司,未经国家电网公司;国家电网公司信息通信分公司;保定市大为计算机软件开发有限公司;国网山东省电力公司济南供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410101286.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种制备高强度复合塑料薄膜的方法
- 下一篇:泡沫陶瓷浸渍成型机