[发明专利]事件格生成方法在审
申请号: | 201711207109.2 | 申请日: | 2017-11-27 |
公开(公告)号: | CN108170709A | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 张亚军 | 申请(专利权)人: | 上海精密计量测试研究所;上海航天信息研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 上海航天局专利中心 31107 | 代理人: | 余岢 |
地址: | 201109 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种事件格生成方法,包括对文本信息进行收集;将收集到的文本信息用自然语言描述出事件知识;对所述事件知识进行形式化描述形成形式事件背景;对所述形式事件背景用渐进式事件格生成算法进行事件格的生成。本发明可以解决异构形式背景知识的概念格生成,具体用来实现形式事件背景到事件格的生成,可以用来解决现有的概念格生成算法无法实现异构形式背景到格的生成的问题。 1 | ||
搜索关键词: | 生成算法 文本信息 异构形式 概念格 自然语言描述 形式化描述 背景知识 | ||
对文本信息进行收集;
将收集到的文本信息用自然语言描述出事件知识;
对所述事件知识进行形式化描述,及对所述形式化描述进行形式事件背景的生成;
对所述形式事件背景用渐进式事件格生成算法进行事件格的生成。
2.如权利要求1所述的事件格生成方法,其特征在于,对文本信息进行收集,包括:通过网络爬取包含事件信息的新闻网页,并以文本文件的格式存放。
3.如权利要求2所述的事件格生成方法,其特征在于,将收集到的文本信息用自然语言描述出事件知识,包括:用自然语言描述新闻文本中的事件知识,包括:事件的名称、事件的动作要素、时间要素、对象要素、环境要素、语言表现要素以及断言要素。
4.如权利要求3所述的事件格生成方法,其特征在于,对所述事件知识进行形式化描述,及对所述形式化描述进行形式事件背景的生成,包括:通过形式化语言将所述事件知识转为形式事件;
将形式事件的集合作为形式事件背景。
5.如权利要求4所述的事件格生成方法,其特征在于,对所述形式事件背景用渐进式事件格生成算法进行事件格的生成,包括:步骤4‑1).初试化事件格为空,即只包含底部根节点({},M);
步骤4‑2).从所述形式事件背景中取出一个事件(e,f(e)),按照内涵势的升序访问现有事件格中的所有节点,设当前访问的事件格节点为L=(A,B):
(1)如果B∩f(e)=B,那么就对事件(e,f(e))与L=(A,B)合并外延,同时将原有的事件格节点更新为(A∪e,B),并为该事件格节点打标记“*”;
(2)如果B∩f(e)≠B,则生成新事件格节点N=(A∪e,B∩f(e)),然后需要找到该子节点的插入位置。由于插入位置只与最优候选父格有关,因此首先判断L是否有最优候选父格F*,在决定插入类型并插入生成事件格节点:
类型1:当前事件格节点没有最优候选父格F*,则置N为L的父格,并为N添加标记“*”;
类型2:当前事件格节点有最优候选父格F*,并且则置F*为N的父格,置L为N的子节点,并为N打上标记“*”。
步骤4‑3):按顺序从所述形式事件背景中取出下一个事件,重复步骤4‑2直到所有事件都插入到事件格。
6.如权利要求5所述的事件格生成方法,其特征在于,判断L是否有最优候选父格F*,包括:输入:事件格节点L=(A,B),所有大于L=(A,B)的新生事件格节点形成的局部事件格LS;
输出:L=(A,B)的最优候选父格集合F*;
按照从小到大的顺序遍历局部事件格LS中所有事件格节点,如果当前访问的事件格节点Lc是L=(A,B)父格,那么将Lc加入F*,并且将为Lc添加不可访问标记;如果Lc不是L=(A,B)的父格,则递归计算Lc的没有标记不可访问的父格是否是最优候选父格,直到LS中没有可以访问的事件格节点则停止迭代。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海精密计量测试研究所;上海航天信息研究所,未经上海精密计量测试研究所;上海航天信息研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711207109.2/,转载请声明来源钻瓜专利网。