[发明专利]一种文献检索方法、设备和存储介质有效
申请号: | 201910816712.3 | 申请日: | 2019-08-30 |
公开(公告)号: | CN110516157B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 黄劲;岑忠满;康阳 | 申请(专利权)人: | 盈盛智创科技(广州)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/958 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 510000 广东省广州市黄埔区伴河路136号160*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文献 检索 方法 设备 存储 介质 | ||
1.一种文献检索方法,其特征在于,包括:
接收自然语言构成的第一检索式;
将所述第一检索式转换为指定格式的第二检索式;
根据所述第二检索式确定适于在文献资料库中检索的关键词、检索条件和结果类型;
在所述检索条件的约束下、根据所述关键词在文献资料库中进行检索,得到符合所述结果类型的文献;
所述将所述第一检索式转换为指定格式的第二检索式包括:
在所述第一检索式中检测HTML字符、指定格式的数字和指定格式的时间段;
当在所述第一检索式中检测到所述HTML字符时,删除所述HTML字符;
当在第一检索式中检测到指定格式的数字时,将所述指定格式的数字转化为阿拉伯数字;
当在第一检索式中检测到指定格式的时间段时,根据所述指定格式的时间段生成用阿拉伯数字表示的时间区间;
所述根据所述第二检索式确定适于在文献资料库中检索的关键词、检索条件和结果类型包括:
对所述第二检索式进行分词处理,以获得检索分词;
识别所述检索分词的词性;
根据所述词性从所述检索分词中确定待屏蔽的检索分词、待作为检索的关键词的检索分词、待作为约束条件的检索分词;
根据所述待作为检索的关键词的检索分词、待作为约束条件的检索分词,确定所述结果类型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述词性从所述检索分词中确定待屏蔽的检索分词、待作为检索的关键词的检索分词、待作为约束条件的检索分词,包括:
筛选所述词性为实体名词的检索分词,作为检索的关键词;
筛选所述词性为阿拉伯数字和字段名词的检索分词,作为约束条件;
筛选副词、助词和语气词的检索分词,作为待屏蔽的检索分词。
3.根据权利要求1-2任一项所述的方法,其特征在于,所述在所述检索条件的约束下、根据所述关键词在文献资料库中进行检索,得到符合所述结果类型的文献,包括:
根据所述关键词在所述文献资料库中确定第一候选文献,所述第一候选文献包括两篇及两篇以上的文献;
使用所述检索条件对所述第一候选文献进行筛选,以获得第二候选文献;
针对所述第二候选文献按照所述结果类型进行返回。
4.根据权利要求3所述的方法,其特征在于,所述针对所述第二候选文献按照所述结果类型进行返回,包括:
确定所述结果类型为聚合类型;
对所述第二候选文献进行聚合分析,以确定聚合结论,所述聚合结论包括所述第二候选文献的数量;
返回所述第二候选文献与所述聚合结论。
5.根据权利要求3所述的方法,其特征在于,所述针对所述第二候选文献按照所述结果类型进行返回,包括:
确定所述结果类型为多实体类型;
返回所述第二候选文献。
6.根据权利要求1-2任一项所述的方法,其特征在于,所述在所述检索条件的约束下、根据所述关键词在文献资料库中进行检索,得到符合所述结果类型的文献,包括:
根据所述关键词在所述文献资料库中确定第三候选文献,所述第三候选文献指向一篇文献;
确定所述结果类型为单实体类型;
使用所述检索条件对所述第三候选文献中的字段名词进行筛选,以获得检索答案;
返回所述第三候选文献与所述检索答案。
7.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6任一所述的一种文献检索方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6任一所述的一种文献检索方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盈盛智创科技(广州)有限公司,未经盈盛智创科技(广州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910816712.3/1.html,转载请声明来源钻瓜专利网。