[发明专利]英文事件同指消解方法和系统有效
申请号: | 201811203139.0 | 申请日: | 2018-10-16 |
公开(公告)号: | CN109359184B | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 程昊熠;李培峰;朱巧明;周国栋;朱晓旭 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 查杰;曹成俊 |
地址: | 215000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种英文事件同指消解方法和系统。本发明英文事件同指消解方法,包括:读取标注文档的事件标注信息,得到标注语料事件集合;统计标注语料事件集合中文档ID、同指ID、事件句ID、事件句类型、事件句子类型、事件句形态以及触发词的起始位置,得到事件句信息集合。本发明的有益效果:利用从事件句中抽取的信息特征和事件对匹配特征,采用循环神经网络对事件对之间的同指关系进行判定;本发明采用循环神经网络模型,利用深度学习来解决事件同指消解问题;本发明的方法和系统,与现有的方法和系统相比,英文事件同指消解性能得到了明显提升。 | ||
搜索关键词: | 英文 事件 消解 方法 系统 | ||
【主权项】:
1.一种英文事件同指消解方法,其特征在于,包括:S10、读取标注文档的事件标注信息,得到标注语料事件集合;统计标注语料事件集合中文档ID、同指ID、事件句ID、事件句类型、事件句子类型、事件句形态以及触发词的起始位置,得到事件句信息集合;S20、对标注语料事件集合中每个实例,调用词形还原工具还原触发词,得到触发词还原词形;调用数据清洗工具和词性标注工具清洗和标注事件句部分,得到新事件句和词性信息;在每个触发词前后各取事件句中的3个单词得到事件短句;以每个触发词为基准,赋予事件句中触发词前后每个单词一个位置下标,得到句内单词位置;用新事件句替换标注语料事件集合中的事件句,并将词性信息、触发词还原词形、事件短句和句内单词位置添入标注语料事件集合的所述实例中;S30、将标注事件句集合中的任意两个事件句信息进行两两组合,得到事件对信息集合;将每个事件对中的触发词原形、事件句类型、事件句子类型和事件句形态进行两两比较(相同置为1,否则为0);根据事件句起始位置和结束位置计算两个事件句是否重叠(重叠值置1,否则置0)和二者距离;根据两个事件句的同指ID判断其是否相同(相同置为1,否则为0);把以上信息都存入事件对匹配集合中;S40、将事件对信息集合和事件对匹配集合作为输入,训练一个基于注意力机制的神经网络模型事件同指消解模型,然后用训练得出的模型对测试集进行预测,得出两个事件句是否存在同指关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811203139.0/,转载请声明来源钻瓜专利网。
- 上一篇:文本信息的查重方法、装置及电子设备
- 下一篇:一种兼职智能搜索排序方法