[发明专利]一种面向结构化医药信息的检索方法和系统有效
申请号: | 201410225580.4 | 申请日: | 2014-05-26 |
公开(公告)号: | CN104035980B | 公开(公告)日: | 2017-08-04 |
发明(设计)人: | 唐力;王和平;周晋;黄权 | 申请(专利权)人: | 王和平 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京科龙寰宇知识产权代理有限责任公司11139 | 代理人: | 孙皓晨,陈士骞 |
地址: | 100007 北京市东城区东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种面向结构化医药信息的检索方法和系统,用以提高检索命中条目与用户检索请求的匹配程度,其中,该检索方法包括以下步骤根据用户提供的一组关键词在结构化信息库中进行检索,其中所述结构化信息库中的每条结构化信息至少包括标题及一组属性;分别计算检索命中的每条结构化信息与用户检索请求的标题匹配度和属性匹配度;根据检索命中的每条结构化信息的标题匹配度和属性匹配度大小向用户返回检索结果。 | ||
搜索关键词: | 一种 面向 结构 医药 信息 检索 方法 系统 | ||
【主权项】:
一种面向结构化医药信息的检索方法,其特征在于,包括以下步骤:根据用户提供的一组关键词在结构化信息库中进行检索,其中所述结构化信息库中的每条结构化信息至少包括标题及一组属性;分别计算检索命中的每条结构化信息与用户检索请求的标题匹配度和属性匹配度;根据检索命中的每条结构化信息的标题匹配度和属性匹配度大小向用户返回检索结果,其中,在根据用户提供的一组关键词在结构化信息库中进行检索步骤之前还包括以下步骤:构建标题/属性索引表,具体包括:设已有词表A,每条结构化信息的标题/属性含有的单个汉字集合为B,按词的长度由大到小对AUB中的词进行排序,得到切词词表C;根据切词词表C逐一对每条结构化信息的标题/属性T进行切词操作f(C,T),f(C,T)=[c1,c2,…cn],其中,ci∈T(即ci是T的子字符串),ci∈C,而且假设ci=T(x,y),且n为自然数,i为大于等于1且小于等于n的自然数,x,y为满足0≤x<y<length(T)的整数,length(T)表示T中含有的字符数;对每个切词操作结果f(C,T)=[c1,c2,…cn],在索引表以ci为键值的索引集合V(ci)中添加(Iid,Ttype),其中,Iid表示该条结构化信息I在结构化信息库中的识别号,Ttype表示该条结构化信息I中标题/属性T的类型;以及对所述结构化信息库进行预处理,具体包括:计算并存储每条结构化信息的标题长度;用以下方法计算并存储每条结构化信息的属性内容完备度:假设t(I)表示结构化信息I的类型,p(I)表示结构化信息I的名称为p的属性,S(t,p)表示类型为t的结构化信息中名称为p的属性的权重,P(I)表示结构化信息I的含有内容的属性集合,则结构化信息I的属性内容完备度为:γ(I)=∑p∈P(I)S(t(I),p(I))。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王和平,未经王和平许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410225580.4/,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置