[发明专利]一种命名实体模糊检索方法与系统有效
申请号: | 201610727015.7 | 申请日: | 2016-08-25 |
公开(公告)号: | CN106294875B | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 罗威;高辉;牛海波;罗准辰;武帅 | 申请(专利权)人: | 中国国防科技信息中心 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 王宇杨;陈琳琳 |
地址: | 100142 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种命名实体模糊检索方法,包括:数据索引步骤,该步骤用于将文本切分成索引单元,进而形成索引文件;其中,所述索引单元包括正常索引词与实体类型词,所述实体类型词是用于表征命名实体类型的词;数据检索步骤,该步骤基于数据索引步骤所建立的数据索引,结合用户提供的检索式向用户提供检索服务。本发明还涉及一种命名实体模糊检索系统。本发明的检索方法与系统使得用户在检索信息时,可按实体类型检索信息,或者同时使用普通检索词和实体类型词进行检索,可有效提升信息检索系统的查全率和查准率。 | ||
搜索关键词: | 一种 命名 实体 模糊 检索 方法 系统 | ||
【主权项】:
1.一种命名实体模糊检索方法,包括:数据索引步骤,该步骤用于将文本切分成索引单元,进而形成索引文件;其中,所述索引单元包括正常索引词与实体类型词,所述实体类型词是用于表征命名实体类型的词;数据检索步骤,该步骤基于数据索引步骤所建立的数据索引,结合用户提供的检索式向用户提供检索服务;所述数据索引步骤包括:命名实体标注步骤,该步骤用于对文本中出现的命名实体进行标注,标注所得到的结果至少包括:命名实体的类型、命名实体在文本中的起始偏移量和终止偏移量;索引单元切分步骤,该步骤用于将文本切分成包含正常索引词和实体类型词的索引单元;包括:在切分索引单元时查找命名实体,若找到命名实体,则输出命名实体的实体类型词、偏移量,若该命名实体所对应的类型存在上位类,还需输出上位命名实体类型到根节点对应的所有实体类型词的实体类型词与偏移量;其中,所述实体类型词根据命名实体的类型编码得到;倒排索引步骤,该步骤以索引词为中心,将同一索引词在不同文档中出现的信息归并存储。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国国防科技信息中心,未经中国国防科技信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610727015.7/,转载请声明来源钻瓜专利网。
- 上一篇:挂灯(甲虫)
- 下一篇:一种开放的三维空间地理信息数据服务方法