[发明专利]知识库的构建方法及装置有效

申请号：	201510515887.2	申请日：	2015-08-20
公开（公告）号：	CN105138631B	公开（公告）日：	2019-10-11
发明（设计）人：	汪平仄;陈志军;龙飞	申请（专利权）人：	小米科技有限责任公司
主分类号：	G06F16/21	分类号：	G06F16/21
代理公司：	北京博思佳知识产权代理有限公司 11415	代理人：	林祥
地址：	100085 北京市海淀区清***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	知识库构建方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开是关于一种知识库的构建方法及装置，其中，知识库的构建方法包括：获取文本语料，根据预设属性描述模式判断文本语料中是否包含第一信息，第一信息包括预设实体集合中的实体的属性信息；在确定文本语料中包含第一信息时，提取第一信息，根据第一信息和第一信息所对应的实体构建知识库。本公开实施例，在构建知识库的过程中不需要通过人工的方式进行知识挖掘，节省了人力且提高了知识库的构建速度。

技术领域

本公开涉及人工智能技术领域，尤其涉及一种知识库的构建方法及装置。

背景技术

命名实体识别(Named Entity Recognition，简称NER)，又称作“专名识别”，是指识别文本中具有特定意义的实体，主要包括人名、地名、机构名、专有名词等。

食物的营养价值是一种特殊的命名实体，包括营养成分名及其含量，例如“碳水化合物”、“20克”。

目前，论坛、留言、博客、新闻和百科上经常会介绍一些食物的营养价值，这些数据对于食物营养价值知识库的构建具有很大的价值。但是，通过人工的方式进行知识挖掘，需要耗费较大的人力且知识库的构建速度慢。

发明内容

本公开实施例提供一种知识库的构建方法及装置，用以解决通过人工方式构建知识库浪费人力且速度慢的问题。

根据本公开实施例的第一方面，提供一种知识库的构建方法，包括：

获取文本语料，根据预设属性描述模式判断所述文本语料中是否包含第一信息，所述第一信息包括预设实体集合中的实体的属性信息；

在确定所述文本语料中包含所述第一信息时，提取所述第一信息，根据所述第一信息和所述第一信息所对应的实体构建所述知识库。

在一实施例中，所述预设属性描述模式包括用于确定所述文本语料中是否包含所述第一信息的词汇、句式或二者的结合；