[发明专利]一种基于多种神经网络集成的因果事理图谱构建方法有效
申请号: | 202010459865.X | 申请日: | 2020-05-27 |
公开(公告)号: | CN111767408B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 云红艳;胡欢;云洋;李正民 | 申请(专利权)人: | 青岛大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/211;G06F40/289;G06F40/30;G06F18/23213;G06N3/045;G06N3/0442;G06N3/08 |
代理公司: | 青岛高晓专利事务所(普通合伙) 37104 | 代理人: | 于正河 |
地址: | 266000 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多种 神经网络 集成 因果 事理 图谱 构建 方法 | ||
本发明属于网络信息技术领域,涉及一种基于多种神经网络集成的因果事理图谱构建方法,先将获取的语料库的获取采用BIO序列标注体系标注数据且分割数据,再用BERT+Bi‑LSTM+Attention+CRF模型进行事件抽取,事件关系抽取时先基于事件抽取元素(O,V)组合成事件并定义事件对及规则特征,再结合事件间规则特征与Bi‑GRU模型抽取因果关系;然后基于事件对利用相似度计算,选取分数最高的两个事件组合成事件i,相似,事件j三元组,再基于事件关系抽取组合原因事件,因果,结果事件三元组,接着采用Neo4j图数据库持久化存储,搭建事理逻辑知识库构建出面向热点话题的因果事理图谱,构建的因果事理图谱能够深层次的提取语义信息,有利于相关监管部门及个人用户对热点事件的实时掌控。
技术领域:
本发明属于网络信息技术领域,涉及一种基于多种神经网络集成的因果事理图谱构建方法。
背景技术:
自从Hinton在Natures上发表深度学习的文章,人工智能新的浪潮随之到来。2012年,CNN夺冠ImageNet,2014年,港中文实验室DeppID算法模型首次超过人眼识别人脸率,2016年,AlphaGo战胜人类高水平围棋选手,2018,谷歌发布Cloud AutoML。但随之人工智能发展进入下一个阶段,让机器去学习掌握人类的知识。例如,理解人类的常识知识“吃饱了”后就会“不饿”。基于深度学习的隐式消费意图研究,能够能让机器知道“结婚”事件伴随“买房子”、“去旅行”等一系列后续消费事件。现有的对话系统、问答系统基于大规模语料中用最大似然估计的方法训练语料集,是一种针对特定模式的记忆。人类的语言知识及语境是复杂多变的,目前机器学习的知识堆上下文前因后果的学习还需要进一步的研究与探索。事理逻辑知识库的构建及其内在信息的挖掘的研究,必将会推动人工智能应用的发展。
Google、Bing、Baidu等将知识图谱技术运用在搜索引擎中,使搜索的时间、准确性及对用户的兴趣得到了大大提升。但是其主要研究的是实体和实体之间的关系,对于事件及事件之间的逻辑挖掘仍缺乏。事理图谱概念的提出,揭示事件的演化规律和发展模式,其包含的事理逻辑知识,事件之间顺承、因果及上下位等关系,对人工智能领域的应用及任务具有潜在的巨大价值。
目前事理图谱的构建及应用研究处于初步阶段,各路学者对其研究中,在构建中阐明存在两大难点:(1)事件抽取:在自然文本中抽取出定义的事件元素如触发词、事件主体、时间、地点等。(2)事件关系抽取:显式的关系抽取依赖于关联词库,隐式关系抽取在没有关联词的情况下抽取出顺承、因果、上下位关系等。在事理图谱的应用研究中跟知识图谱一样具有多样的应用场景,如消费者意图挖掘、问答系统、辅助决策系统、对话生成等。
发明内容:
本发明的目的在于克服现有技术存在的缺点,设计一种基于多种神经网络集成的因果事理图谱构建方法,包含3个主要关键技术:(1)事件抽取:首先是语料库的获取,采用Scrapy与无监督学习Kmeans算法,其次是事件的定义及采用BIO序列标注体系标注数据且分割数据成训练集、验证集与测试集,接着用BERT+Bi-LSTM+Attention+CRF模型进行事件抽取;(2)事件关系抽取:首先是基于事件抽取元素(O,V)组合成事件,接着定义事件对及规则特征,然后结合事件间规则特征与Bi-GRU模型抽取因果关系;(3)事件知识存储:首先基于事件对利用相似度计算,选取分数最高的两个事件组合成事件i,相似,事件j三元组,然后基于事件关系抽取组合原因事件,因果,结果事件三元组,接着采用Neo4j图数据库持久化存储,搭建事理逻辑知识库构建出面向热点话题的因果事理图谱。
为了实现上述发明目的,本发明所述基于多种神经网络集成的因果事理图谱构建方法包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛大学,未经青岛大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010459865.X/2.html,转载请声明来源钻瓜专利网。