[发明专利]一种事理图谱在线扩展方法及装置有效
申请号: | 202110217425.8 | 申请日: | 2021-02-26 |
公开(公告)号: | CN112948552B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 赵刚;杨昊;王兴芬 | 申请(专利权)人: | 北京信息科技大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/36 |
代理公司: | 北京天方智力知识产权代理事务所(普通合伙) 11719 | 代理人: | 路远 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 事理 图谱 在线 扩展 方法 装置 | ||
1.一种事理图谱在线扩展方法,其特征是,该方法包括以下步骤:
获取历史新闻文本数据,构建事理图谱;
获取最新新闻文本数据,对最新新闻文本数据进行事件关系的匹配及事件抽取;
基于自适应泛化模型,利用抽取到的最新新闻文本数据的前件事件和后件事件,对构建的事理图谱进行在线扩展;
其中,所述事理图谱的构建方法为:
利用事件关系规则,构建因果事件规则库,根据因果事件规则库中事件关系规则,对历史新闻文本数据进行事件关系匹配,提取出历史新闻文本数据的前件和后件;
对提取出的历史新闻文本数据的前件和后件进行分词,抽取历史新闻文本数据的前件和后件中的事件,形成历史新闻文本数据的三元组;
基于事件泛化的聚类方法和自适应泛化模型,对历史新闻文本数据的三元组中前件事件和后件事件进行泛化,初步形成事理图谱,并保存自适应泛化模型中事理图谱的记忆权值;
其中,所述自适应泛化模型为:
zi=xi+aui
vi=f(qi)+bf(si)
其中,a,b为正反馈系数,c为r向量的计算参数,d为调整的步幅值,e为弱归一化参数,ρ为设定的阈值,θ为门限值,I为获胜类别,xi为输入变量,zi为x向量的线性组合,|Z|为z向量的模长,qi为z的归一化向量,si为p的归一化向量,f(x)为滤波函数,|V|为v向量的模长;yj为输出向量,M为最大类别数,ui为v的归一化向量,w为记忆权值,ri为相似度向量,|U|为u向量的模长,pi为F1层和F2层交互向量,F1为输入比较层,F2为识别层,|R|为r向量的模长;当|R|+e≤ρ,则系统进入谐振,按照式和式更新权值。
2.根据权利要求1所述的事理图谱在线扩展方法,其特征是,所述事件泛化的聚类方法为:
统计新闻文本数据的三元组中前件事件和后件事件完全相同的元组数量;
将历史新闻文本数据的三元组中语义相似的事件聚为一类,并将这些事件所对应的元组数量值相加,得到元组数量总和;
根据每个事件的元组数量及元组数量总和,计算每个事件的概率。
3.根据权利要求2所述的事理图谱在线扩展方法,其特征是,所述每个事件的概率的计算方法为:
其中,i为事件,n为i事件的出度,counti为事件i的元组数量。
4.根据权利要求1所述的事理图谱在线扩展方法,其特征是,所述对构建的事理图谱进行在线扩展的步骤包括:
将最新新闻文本数据的前件事件和后件事件进行向量化表示,并输入自适应泛化模型;
根据自适应泛化模型中事理图谱的记忆权值,计算得到最新新闻文本数据的前件事件和后件事件的竞争获胜者,并分别计算竞争获胜者与输入事件的相似度,将相似度与设定的阈值进行比较;
若最新新闻文本数据的前件事件和后件事件中至少一个事件的所有获胜者相似度均小于设定的阈值,利用最新新闻文本数据的前件事件和/或后件事件激活自适应泛化模型中新的计算单元,并根据计算单元所指类别中动词和名词出现的频率,人工标注新事件节点标签,生成新的事件边;
若最新新闻文本数据的前件事件和后件事件两者的所有竞争获胜者的相似度均大于设定的阈值,则调整自适应泛化模型中事理图谱的记忆权值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110217425.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种空间机器人用关节可靠性验证方法
- 下一篇:空调控制方法、装置及空调机组