[发明专利]一种基于ES的药品搜索方法、系统、设备及存储介质在审
申请号: | 202211284637.9 | 申请日: | 2022-10-17 |
公开(公告)号: | CN115618089A | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 王俊骥;向伟 | 申请(专利权)人: | 重庆普小云科技有限公司 |
主分类号: | G06F16/9532 | 分类号: | G06F16/9532;G06F40/289;G06F40/30;G06F16/9535;G06F16/9538 |
代理公司: | 重庆智慧之源知识产权代理事务所(普通合伙) 50234 | 代理人: | 余洪 |
地址: | 401120 重庆市渝北区仙桃街*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 es 药品 搜索 方法 系统 设备 存储 介质 | ||
1.一种基于ES的药品搜索方法,其特征在于,包括以下步骤:
获取用户输入信息和用户信息,根据所述用户信息和预设过滤条件对数据库中的药品信息进行过滤,得到过滤后的药品集合;
对所述用户输入信息进行中文语义识别,获取语义处理后的分词集合;
将所述分词集合中的分词通过ES搜索引擎在所述药品集合中进行搜索,获取初始搜索结果,根据所述初始搜索结果计算对应药品与分词集合的匹配度得分;
获取预设的匹配度阈值,根据所述匹配度得分与匹配度阈值的关系,获取一个或多个药品作为搜索目标,并基于所述匹配度得分对搜索目标中的药品进行降序排列,得到搜索结果;
获取所有的历史搜索结果,统计所述历史搜索结果中符合预设条件的药品信息,获取目标药品集合。
2.根据权利要求1所述的一种基于ES的药品搜索方法,其特征在于,所述获取用户输入信息和用户信息,具体包括:
获取用户输入信息和用户输入信息中携带的所属用户ID;
根据所述用户ID查询获取用户信息,所述用户信息包括用户权限、历史购买记录和用户经营药品的管控范围,所述用户权限包括药品批发资质、用户征信和区域管控权限。
3.根据权利要求2所述的一种基于ES的药品搜索方法,其特征在于,所述根据用户信息和预设过滤条件对数据库中的药品信息进行过滤,得到过滤后的药品集合,具体包括:
根据所述用户信息提取对应的属性条件,并基于所述属性条件对数据库中药品信息进行过滤,获取预过滤药品集合;
获取预设过滤条件,根据所述预设过滤条件,对所述预过滤药品集合进行二次过滤,得到过滤后的药品集合。
4.根据权利要求1所述的一种基于ES的药品搜索方法,其特征在于,所述对所述用户输入信息进行中文语义识别,获取语义处理后的分词集合,具体包括:
设置分词器的字典和停用词字典及ES搜索引擎中的同义词字典;
基于所述停用词字典,剔除所述用户输入信息中的停用词;
根据所述用户信息的词性和字典进行分词,获取初步分词集合;
根据所述初步分词集合中的分词,并标注词性,在所述同义词字典中查询对应的同义词,并添加到所述初步分词集合中,得到语义处理后的分词集合。
5.根据权利要求2所述的一种基于ES的药品搜索方法,其特征在于,所述将所述分词集合中的分词通过ES搜索引擎在所述药品集合中进行搜索,获取初始搜索结果,根据所述初始搜索结果计算对应药品与分词集合的匹配度得分,具体包括:
通过所述ES搜索引擎,对所述分词集合与所述药品集合中的药品进行匹配查询;
采用BM25算法计算所述药品与分词集合的匹配度得分,公式为:
式中,Q表示用户输入信息,对Q进行分词,得到q1,q2,...,qt的词序列,在给定文本d∈D时,计算Q和d之间的匹配度得分,公式为:
Score(Q,d)=∑ti=1*R(qi,d)
式中,wi表示qi的权重,R(qi,d)为qi和d的相关性,Score(Q,d)为每个分词qi和d的相关性的加权和,其中:
wi=IDF(qi)=logN-n(qi)+0.5n(qi)+K
式中,N表示文本集合中文本的总数量,n(qi)表示包含分词qi的文本数量,K用于进行平滑处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆普小云科技有限公司,未经重庆普小云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211284637.9/1.html,转载请声明来源钻瓜专利网。