[发明专利]一种实体描述推理知识库构建与推理证据量化信息获取方法和装置在审
申请号: | 202011435544.2 | 申请日: | 2020-12-07 |
公开(公告)号: | CN112667819A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 刘焕勇;刘张宇;邹志龙 | 申请(专利权)人: | 数据地平线(广州)科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N5/02;G06N5/04 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 511458 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实体 描述 推理 知识库 构建 证据 量化 信息 获取 方法 装置 | ||
本发明涉及一种实体描述推理知识库构建与推理证据量化信息获取方法和装置。该方法利用大规模非结构化开放文本建立实体描述推理知识库,所述实体描述推理知识库包括实体描述知识库和实体关联传导库;针对输入的事件或事件描述列表、事件对或事件描述对列表,通过实体链接,在实体描述推理知识库中进行检索,返回事件之间的推理证据与传导强度。本发明拓宽了现有逻辑推理类知识库的范围,可提高现有知识库的逻辑推理能力;本发明可以灵活地应用于单事件推理、双事件对推理等不同推理场景,并在获取方式上可根据实际需求快速变换。
技术领域
本发明涉及一种实体描述推理知识库构建与推理证据量化信息获取方法和装置,属于自然语言处理领域,属于一种特定类别的知识库构建与应用推理方法。
背景技术
知识推理是人工智能的高级阶段,基于已有知识,运用知识推理机技术,完成限定领域决策行为,能够在充分减少人为劳动的同时,产生经济效益。例如,基于已知知识进行知识推理,采用如事件驱动传导路径等进行知识发现,能够辅助于业务的推理和辅助决策,在智能投研进行未知风险预警、在舆情分析中对公司进行舆论控制和监控。
为了完成以上推理工作,包括1)较大规模具有推理性的知识库作为基础数据资源;2)在推理过程中的一种人类友好、可信、可解释的知识推理展现方式等两个核心点。其中,从大规模开放文本中,通过逻辑性知识的抽取,可以形成大规模具有推理描述能力的知识库,即指具有逻辑刻画能力、由具有逻辑性推理因子组成的一类常识知识。可信、可解释的知识推理方式对推理的过程做出了要求,要求推理的路径是透明的、推理路径可信、可量化、可以方便人类很好地理解。
受限于当前的自然语言处理技术水平,当前围绕事件推理,目前在逻辑推理类知识库的构建和应用上还存在以下不足:
1、现有逻辑知识库的维度相对局限。现有公开的逻辑推理知识库,主要还是集中于事理演化逻辑(如因果演化、条件演化等)、产业链传导逻辑及相关外延的知识库构建,对其他类型的逻辑推理知识库构建还有待进一步挖掘。
2、现有事件推理传导量化的数据缺失。当前事件推理过程中存在着传导性量化问题,量化问题在很大程度上取决于可以量化的数据指标,而这些数据大多并不开放,造成了数据的失真。利用实体描述中的数值等级计算,可以得到事件推理的权重。在逻辑外延上,实体描述知识的一个重要优势在于“解放数据”,实体的描述中存在着大量对数据的统计结论。
3、现有事件推理传导证据的显示缺失。当前事件推理可解释展示过程中直接以事件之间各个可推理节点、以及节点之间的边为元素作图,对传导边的实证证据来源展示不够有效。这一缺失,不易保证推理的可信度和可靠性。
4、对实体逻辑的挖掘和应用探索不足。实体描述知识是一类重要的逻辑推理因子和应用对象。现实情境下特定实体进行真实的实体描述,隐藏着大量的潜在推理线索,是另一种十分有效的推理因子,其既可以填充现有逻辑的空隙,也可进一步拓宽推理逻辑的外延。例如,智利是世界上已知锂储量最大、锂矿开采最多的国家,也是全球最大铜出产国、中国精炼铜最大供应国等描述信息可以折射出智利在锂矿和铜矿供应链上的关键地位。
发明内容
针对现有技术中存在的现状和问题,本发明的目的在于提出一种实体描述推理知识库构建与事件推理证据量化信息获取方法和装置。
本发明由实体描述推理知识库构建模块和事件推理证据量化信息获取两个组成部分构成。本发明的主要思想为运用自然语言处理手段,面向大规模非结构化开放文本中具有明确介绍性描述的表达进行实体描述知识抽取,利用量化和统计手段,将实体、关联实体以及之间的明显传导关联进行量化,并将关联描述作为传导证据进行记录存储,最终形成大规模实体描述推理知识库。基于实体描述推理知识库,通过事件实体链接和匹配的方法,针对特定输入事件或事件对列表,自动获取具有量化信息的推理证据和关联推理信息。
本发明采用的技术方案如下:
一种实体描述推理知识库构建与推理证据量化信息获取方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于数据地平线(广州)科技有限公司,未经数据地平线(广州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011435544.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种节约用水防扬尘的道路用切缝装置
- 下一篇:运动侦测系统及方法