[发明专利]一种面向结构化医药信息的检索方法和系统有效

专利信息
申请号: 201410225580.4 申请日: 2014-05-26
公开(公告)号: CN104035980B 公开(公告)日: 2017-08-04
发明(设计)人: 唐力;王和平;周晋;黄权 申请(专利权)人: 王和平
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京科龙寰宇知识产权代理有限责任公司11139 代理人: 孙皓晨,陈士骞
地址: 100007 北京市东城区东*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开一种面向结构化医药信息的检索方法和系统,用以提高检索命中条目与用户检索请求的匹配程度,其中,该检索方法包括以下步骤根据用户提供的一组关键词在结构化信息库中进行检索,其中所述结构化信息库中的每条结构化信息至少包括标题及一组属性;分别计算检索命中的每条结构化信息与用户检索请求的标题匹配度和属性匹配度;根据检索命中的每条结构化信息的标题匹配度和属性匹配度大小向用户返回检索结果。
搜索关键词: 一种 面向 结构 医药 信息 检索 方法 系统
【主权项】:
一种面向结构化医药信息的检索方法,其特征在于,包括以下步骤:根据用户提供的一组关键词在结构化信息库中进行检索,其中所述结构化信息库中的每条结构化信息至少包括标题及一组属性;分别计算检索命中的每条结构化信息与用户检索请求的标题匹配度和属性匹配度;根据检索命中的每条结构化信息的标题匹配度和属性匹配度大小向用户返回检索结果,其中,在根据用户提供的一组关键词在结构化信息库中进行检索步骤之前还包括以下步骤:构建标题/属性索引表,具体包括:设已有词表A,每条结构化信息的标题/属性含有的单个汉字集合为B,按词的长度由大到小对AUB中的词进行排序,得到切词词表C;根据切词词表C逐一对每条结构化信息的标题/属性T进行切词操作f(C,T),f(C,T)=[c1,c2,…cn],其中,ci∈T(即ci是T的子字符串),ci∈C,而且假设ci=T(x,y),且n为自然数,i为大于等于1且小于等于n的自然数,x,y为满足0≤x<y<length(T)的整数,length(T)表示T中含有的字符数;对每个切词操作结果f(C,T)=[c1,c2,…cn],在索引表以ci为键值的索引集合V(ci)中添加(Iid,Ttype),其中,Iid表示该条结构化信息I在结构化信息库中的识别号,Ttype表示该条结构化信息I中标题/属性T的类型;以及对所述结构化信息库进行预处理,具体包括:计算并存储每条结构化信息的标题长度;用以下方法计算并存储每条结构化信息的属性内容完备度:假设t(I)表示结构化信息I的类型,p(I)表示结构化信息I的名称为p的属性,S(t,p)表示类型为t的结构化信息中名称为p的属性的权重,P(I)表示结构化信息I的含有内容的属性集合,则结构化信息I的属性内容完备度为:γ(I)=∑p∈P(I)S(t(I),p(I))。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王和平,未经王和平许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410225580.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top