[发明专利]一种语义检索方法及检索系统有效
申请号: | 201810144154.6 | 申请日: | 2018-02-12 |
公开(公告)号: | CN108280225B | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 柯红伟;张诚;陈海宁 | 申请(专利权)人: | 北京吉高软件有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332 |
代理公司: | 北京知联天下知识产权代理事务所(普通合伙) 11594 | 代理人: | 王冲;吴鑫 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语义 检索 方法 检索系统 | ||
本发明提供了一种语义检索方法及系统,其中方法包括:将任意多个模块化语义检索流程进行一次组合或多次组合,形成检索条件规则;利用所述形成的检索条件规则进行语义检索;其中,所述模块化语义检索流程包括:客观式概念相似度语义检索流程,客观式概念匹配度语义检索流程,主观式内容关键字语义检索流程和主观式正则表达式语义检索流程。本发明的方法及系统可以将各种检索方式进行模块化组合,用户可以按照实际需求灵活组合检索方式,满足了用户的个性化需求。
技术领域
本发明涉及信息检索技术领域,特别涉及一种语义检索方法及系统。
背景技术
随着科学的发展、技术的创新,科技信息、资讯信息等各类信息以指数形式呈现爆发式地增长。而无论是科学技术研究、还是社会管理都离不开文献的检索。如何在海量的信息中精准并全面地获得目标内容,这对搜索技术提出了更好的要求。
目前,存在着众多搜索引擎系统,这些搜索引擎一般采用单一的检索方式:通过用户输入的原始关键词进行检索,或者通过语义分析进行检索,或者通过其他的单一方式进行检索。这种检索方式比较单一,在面对当前海量的信息时,搜索比较低效,而且搜索出的结果往往含有大量的非目标内容,极大地影响了用户的使用感受。
发明内容
针对现有技术中搜索方式单一的问题,本发明提出了一种组合式的语义检索方法及检索系统。
一种语义检索方法,所述方法包括:
将任意多个模块化语义检索流程进行一次组合或多次组合,形成检索条件规则;
利用所述形成的检索条件规则进行语义检索;
其中,所述模块化语义检索流程包括:
客观式概念相似度语义检索流程,其通过文本内容利用相似度进行语义检索,
客观式概念匹配度语义检索流程,其利用训练的检索模型进行筛选,
主观式内容关键字语义检索流程,其利用设定的关键字或关键词进行语义检索,
主观式正则表达式语义检索流程,其利用正则表达式进行语义检索。
进一步地,在所述语义检索流程中构建语义检索条件模型。
进一步地,
对上述形成的检索条件规则进行存储,和/或,
对构建的语义检索条件模型进行存储。
进一步地,
所述通过文本内容利用相似度进行语义检索具体为,通过对文本内容进行语料分析,确定内容相似度;
所述利用设定的关键字或关键词进行语义检索具体为,将所述关键字或关键词组合成逻辑表达式进行检索。
所述正则表达式,是表示检索目标特征的表达式。
进一步地,在所述客观式概念相似度语义检索流程中,能够利用内容相似度和/或内容相似文本数量对检索结果进行限制。
进一步地,在利用所述训练的检索模型进行筛选的过程中,将获得的反例反馈到所述训练的检索模型中,对所述检索模型进行再次训练。
一种语义检索系统,所述系统包括:
相似度检索模块,用于构建文本语义检索条件模型;
匹配度检索模块,用于利用训练的检索模型进行筛选;
关键字检索模块,用于构建关键词语义检索条件模型;
表达式检索模块,用于构建正则表达式语义检索条件模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京吉高软件有限公司,未经北京吉高软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810144154.6/2.html,转载请声明来源钻瓜专利网。