[发明专利]一种命名实体模糊检索方法与系统有效

专利信息
申请号: 201610727015.7 申请日: 2016-08-25
公开(公告)号: CN106294875B 公开(公告)日: 2019-05-17
发明(设计)人: 罗威;高辉;牛海波;罗准辰;武帅 申请(专利权)人: 中国国防科技信息中心
主分类号: G06F16/36 分类号: G06F16/36
代理公司: 北京方安思达知识产权代理有限公司 11472 代理人: 王宇杨;陈琳琳
地址: 100142 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种命名实体模糊检索方法,包括:数据索引步骤,该步骤用于将文本切分成索引单元,进而形成索引文件;其中,所述索引单元包括正常索引词与实体类型词,所述实体类型词是用于表征命名实体类型的词;数据检索步骤,该步骤基于数据索引步骤所建立的数据索引,结合用户提供的检索式向用户提供检索服务。本发明还涉及一种命名实体模糊检索系统。本发明的检索方法与系统使得用户在检索信息时,可按实体类型检索信息,或者同时使用普通检索词和实体类型词进行检索,可有效提升信息检索系统的查全率和查准率。
搜索关键词: 一种 命名 实体 模糊 检索 方法 系统
【主权项】:
1.一种命名实体模糊检索方法,包括:数据索引步骤,该步骤用于将文本切分成索引单元,进而形成索引文件;其中,所述索引单元包括正常索引词与实体类型词,所述实体类型词是用于表征命名实体类型的词;数据检索步骤,该步骤基于数据索引步骤所建立的数据索引,结合用户提供的检索式向用户提供检索服务;所述数据索引步骤包括:命名实体标注步骤,该步骤用于对文本中出现的命名实体进行标注,标注所得到的结果至少包括:命名实体的类型、命名实体在文本中的起始偏移量和终止偏移量;索引单元切分步骤,该步骤用于将文本切分成包含正常索引词和实体类型词的索引单元;包括:在切分索引单元时查找命名实体,若找到命名实体,则输出命名实体的实体类型词、偏移量,若该命名实体所对应的类型存在上位类,还需输出上位命名实体类型到根节点对应的所有实体类型词的实体类型词与偏移量;其中,所述实体类型词根据命名实体的类型编码得到;倒排索引步骤,该步骤以索引词为中心,将同一索引词在不同文档中出现的信息归并存储。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国国防科技信息中心,未经中国国防科技信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610727015.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top