[发明专利]知识库实体归一方法、系统、终端和计算机可读存储介质有效
申请号: | 201810073982.5 | 申请日: | 2018-01-25 |
公开(公告)号: | CN108154198B | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 冯知凡;陆超;徐也;方舟;朱勇;李莹 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N5/02 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 张臻贤;李够生 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种知识库实体归一方法、系统、终端和计算机可读存储介质,方法包括获取知识库中的实体集合;采用多种分区方式对实体集合进行预分区;根据预分区的结果进行样本构建;根据预分区的结果进行特征构建;通过至少一个归一模型对各个实体对进行归一判定;对归一判定的结果进行集合划分。系统包括获取模块用于获取知识库中的实体集合;多维分区模块用于对实体集合进行预分区;样本构建模块用于根据预分区的结果进行样本构建;特征构建模块用于根据预分区的结果进行特征构建;归一判定模块,用于对预分区的结果中的各实体对进行归一判定;集合划分模块用于对归一判定的结果进行集合划分。本发明能够解决大规模知识库的实体归一问题。 | ||
搜索关键词: | 知识库 实体 方法 系统 终端 计算机 可读 存储 介质 | ||
【主权项】:
一种知识库实体归一方法,其特征在于,包括:获取知识库中的实体集合;采用多种分区方式相结合对所述实体集合进行预分区;根据所述预分区的结果进行样本构建,提取关键样本;根据所述预分区的结果进行特征构建,提取相似特征;通过至少一个归一模型结合所述关键样本和所述相似特征,对各个所述实体对进行归一判定,判定各所述实体对是否为相同实体;以及对所述归一判定的结果进行集合划分。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810073982.5/,转载请声明来源钻瓜专利网。