[发明专利]一种基于递归神经网络的文本语言关联抽取方法和系统在审
申请号: | 201811600745.6 | 申请日: | 2018-12-26 |
公开(公告)号: | CN111368542A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 韩英;陈薇;王腾蛟;李强;刘迪;黄晓光 | 申请(专利权)人: | 北京大学;国网信息通信产业集团有限公司;国家电网有限公司;国网浙江省电力有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/31;G06F16/36;G06N3/04;G06N3/08 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于递归神经网络的文本语言关联抽取方法和系统。该方法基于递归神经网络(双向长短期记忆网络)自动提取复杂的上下文特征,对上下文的语义信息进行编码;通过基于规则的实体表述对抽取器发现文档内的定义模式,识别文档内部关于非标准表述的定义,并抽取定义的从属于同一个实体概念的标准表述与非标准表述;将抽取到的实体表述对的特征进行编码,把关于实体归一化的信息嵌入到低维的实体表述向量;实体表述向量与上下文特征编码向量联结起来并进行维度转换得到最终的编码;基于条件随机场的解码器结合编码器学习到的特征与状态之间的转移概率,解码出全局最优的状态序列作为最终的输出序列。本发明能够有效提升实体识别的性能。 | ||
搜索关键词: | 一种 基于 递归 神经网络 文本 语言 关联 抽取 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学;国网信息通信产业集团有限公司;国家电网有限公司;国网浙江省电力有限公司,未经北京大学;国网信息通信产业集团有限公司;国家电网有限公司;国网浙江省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811600745.6/,转载请声明来源钻瓜专利网。