[发明专利]一种用于网络搜索的短句检索方法在审
申请号: | 201810145923.4 | 申请日: | 2018-02-12 |
公开(公告)号: | CN108268663A | 公开(公告)日: | 2018-07-10 |
发明(设计)人: | 杨良军 | 申请(专利权)人: | 安徽千云度信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 冯子玲 |
地址: | 230000 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于网络搜索的短句检索方法,涉及信息检索技术领域。包括以下步骤:(1)中文分词和词性标注、(2)句法分析、(3)词语加权计算、(4)搜索引擎处理和(5)结果排序计算。本发明改进现有的基于统计的短句分析算法给出一种引入祖先节点信息和位置信息更适用于短句分析的算法,有效的提高了整句和短句正确率减少繁杂的不必要的信息;通过对于短句中关键词的加权算法和引入词语权值给出一种返回文档得分的计算方法并依据该方法的搜索结果进行排序,从而使搜索结果能更好的反应用户搜索意图,有效提高结果返回的准确率并使得满足用户需求的文档排在靠前位置,使用户快速得到自己想要的结果。 | ||
搜索关键词: | 短句 搜索结果 网络搜索 文档 词语 检索 信息检索技术 用户搜索意图 词性标注 分析算法 加权计算 加权算法 结果返回 结果排序 句法分析 搜索引擎 用户需求 中文分词 祖先节点 引入 正确率 准确率 算法 排序 返回 改进 统计 分析 | ||
【主权项】:
1.一种用于网络搜索的短句检索方法,其特征在于,包括以下步骤:(1)中文分词和词性标注:对输入的短句进行按词典进行分词,并通过分析上下文确定每个词在句子中的词性,分析结果为一串带有词性标注的词串;(2)句法分析:在中文分析和词性标注的基础上,应用改进的规则库和依据该改进的规则库进行句法分析计算,将带有词性标注的词串分析为表示句法结构的树状结构;(3)词语加权计算:依据词性标注和句法分析的结果,对词性和词语在句子中的结构信息进行分析得出其权值,通过数值形式表示词语在查询短语中的重要性,使得结果能更好的表达用户搜索意图;(4)搜索引擎处理:根据词语加权的结果,对权值进行分析并设置阀值较低的词语剔除,然后将剩下的词语带权值输入搜索引擎进行检索;(5)结果排序计算:将词频统计、反转频率和相对长度等检索中排序常用信息和词语加权结果相结合,将查询结果进行评分,然后根据所得分数进行排序。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽千云度信息技术有限公司,未经安徽千云度信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810145923.4/,转载请声明来源钻瓜专利网。