[发明专利]一种基于层次深度语义的隐式篇章关系分析方法有效

专利信息
申请号: 201610739516.7 申请日: 2016-08-26
公开(公告)号: CN106326212B 公开(公告)日: 2019-04-16
发明(设计)人: 鉴萍;佘萧寒;黄河燕 申请(专利权)人: 北京理工大学
主分类号: G06F17/27 分类号: G06F17/27;G06F16/35;G06F16/36
代理公司: 北京理工正阳知识产权代理事务所(普通合伙) 11639 代理人: 王民盛
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于层次深度语义的隐式篇章关系分析方法,属于自然语言处理应用技术领域。包括以下步骤:首先结合已标注和未标注语料,扩充训练语料规模,避免训练语料规模过小带来欠学习问题;然后基于一定规则初始化训练语料各层次的深度语义向量,通过信息增益值的大小筛选出有助于分类的词对,将其作为后续特征选取依据;最后设计一种打分函数,将待分类篇章关系论元对的多层次的深度语义信息相结合,利用神经网络训练模型参数并拟合隐式篇章关系类别标签,找到使性能达到最优的模型完成隐式篇章关系分析。弥补了基于离散特征的传统方法导致的错判;提升隐式篇章关系类别标签的分析精度;使用户能更快速而准确地获得隐式篇章关系的分析结果。
搜索关键词: 隐式 关系分析 训练语料 语义 层次深度 类别标签 标注 神经网络训练 应用技术领域 自然语言处理 离散特征 模型参数 特征选取 信息增益 语义向量 语义信息 初始化 关系论 分类 拟合 语料 筛选 分析 学习
【主权项】:
1.一种基于层次深度语义的隐式篇章关系分析方法,其特征在于:包括以下步骤:步骤一、语料预处理,具体为:步骤1.1将已有的隐式篇章关系标注语料,分割为训练语料和测试语料;步骤1.1中,分割的比例为:标注语料共有0‑22Section,其中2‑20Section作为训练语料,21‑22Section作为测试语料;步骤1.2利用篇章连接词匹配的方法,从大规模未标注语料中匹配显式篇章连接词;步骤1.3基于步骤1.2的结果,以篇章连接词和标点为边界划分论元范围,提取出相应的显式篇章关系;步骤1.4将步骤1.3输出的篇章连接词去除,作为伪隐式篇章关系扩充步骤1.1所得的训练语料;步骤二、多层次语义向量初始化,具体为:步骤2.1利用Paragraph Vector方法,采用词向量训练模型训练词向量,并将隐式篇章关系论元对所对应的句向量,添加到当前待训练词的上下文中,和词向量一同训练;步骤2.1中,所述的词向量训练模型,可以采用word2vec;其中,所述的隐式篇章关系为步骤1.4所得训练语料中的隐式篇章关系;步骤2.2将步骤2.1所得结果,以及隐式篇章关系各类别的先验概率,作为步骤三及步骤四所使用的各个层次的隐式篇章关系深度语义向量的初始值;其中,各个层次即多层次;步骤三、生成有用词对表并扩充有用词对表,具体为:步骤3.1将步骤1.4所获取的训练语料作为提取对象,针对每一个隐式篇章关系,从上下两个论元中分别抽取一个词语构成词对,将词对作为研究对象,统计训练语料中所有词对在各篇章关系类别中的信息增益值大小,选取高于阈值的词对构建有用词对表;步骤3.2在步骤3.1基础上,利用词向量的相似度计量,扩充步骤3.1所得的有用词对表;步骤四、隐式篇章关系模型训练和类别打分,具体为:步骤4.1针对步骤一所得的训练语料和测试语料中的隐式篇章关系,提取其中包含的有用词对,将词对转换为词向量的拼接形式,同隐式篇章关系论元对向量、隐式篇章关系分布向量相拼接,构成隐式篇章关系的层次深度语义的表征;步骤4.2把步骤4.1中拼接得到的训练语料隐式篇章关系层次深度语义向量,加入到神经网络训练模型中,训练模型参数;步骤4.3把步骤4.1中拼接得到的测试语料隐式篇章关系层次深度语义向量,加入到步骤4.2所得的神经网络训练模型中,拟合隐式篇章关系类别标签给出的相应分数,输出待分类隐式篇章关系的识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610739516.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top