[发明专利]一种军事新闻长文本层次化事件抽取方法在审
申请号: | 202110970577.5 | 申请日: | 2021-08-23 |
公开(公告)号: | CN113657090A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 张静;胡军;栾瑞鹏;孙悦 | 申请(专利权)人: | 中国人民解放军32801部队 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/289;G06F40/258;G06K9/62;G06F16/35;G06F16/951 |
代理公司: | 北京丰浩知识产权代理事务所(普通合伙) 11781 | 代理人: | 李学康 |
地址: | 100082 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种军事新闻长文本层次化事件抽取方法,其具体步骤包括,获取军事新闻资讯网页的内容,提取该类网页中的军事新闻文本数据;进行文本预处理,对军事新闻文本的内容进行分词和词性标注,对军事新闻文本的标题进行分词并构建触发词,得到军事新闻文本标题的归类结果;识别出军事新闻文本中的事件句;筛选出军事新闻文本中与触发词的相似度大于一定阈值的事件句;从事件句中提取事件要素,进行角色标注;根据事件元素的角色描述结果,进行事件描述。本发明确定语句表达主旨的、贡献度最大的词汇作为军事新闻的触发词,使用触发词归类事件类别并将事件要素进行串联,构成篇章级别的军事新闻超长文本的事件链。 | ||
搜索关键词: | 一种 军事新闻 文本 层次 事件 抽取 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军32801部队,未经中国人民解放军32801部队许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110970577.5/,转载请声明来源钻瓜专利网。