[发明专利]一种基于宽度随机森林的句法依存模型、训练方法和分析方法有效
申请号: | 201910494216.0 | 申请日: | 2019-06-06 |
公开(公告)号: | CN110458181B | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 刘鹏;张国鹏;孟磊;王学奎;魏卉子;景江波;鹿晓龙;叶帅 | 申请(专利权)人: | 中国矿业大学 |
主分类号: | G06F40/211 | 分类号: | G06F40/211 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 李悦声 |
地址: | 221116 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于宽度随机森林的句法依存模型、训练方法和分析方法,适用于句法依存分析使用。将随机森林集成模型用于基于转移的句法依存分析中,进行局部依存构建预测,主要包括模型设计和模型训练两部分,模型设计部分主要包括特征映射层和增强层的设计、输出权重的设计两部分,通过设计随机森林和完全随机森林组成的神经网络节点,以自适应调节模型的宽度,通过节点的平均准确率得到本地权重计算输出权重,最后求解最终输出向量。其自动化程度高,通过训练自适应决定模型大小,理论分析容易、可解释性以及并行化能力强。 | ||
搜索关键词: | 一种 基于 宽度 随机 森林 句法 依存 模型 训练 方法 分析 | ||
【主权项】:
1.一种基于宽度随机森林的句法依存模型,其特征在于:它包括特征映射层、增强层和输出权重层构成的随机森林模型,特征映射层由n个随机森林节点组成,每个节点均由一个“随机森林”和一个“完全随机森林”组成,节点输出结果为两个随机森林输出结果的平均值,通过设计随机森林和完全随机森林组成的神经网络节点,以自适应调节模型的宽度,增强层由特征映射层的输出与原始输入特征向量拼接构成,通过节点的平均准确率得到本地权重,而后按照输出权重,对特征映射层及增强层所有节点的输出进行加权求和得到最终输出;将每个原始输入数据处理得到输入特征向量,其中对于具有空间联系的原始输入数据使用多粒度扫描进行处理得到输入特征向量,将各个特征间不存在空间关系的一维输入数据作为输入特征向量,将处理得到的一维输入数据特征向量作为一个样本生成包含n个节点的特征映射层,求解每个特征映射层节点的本地权重,将本地权重低于一维输入数据节点重新生成随机森林,k为类别数量;然后将每个样本经过特征映射层得到的输出同原始特征向量合并作为一个样本生成包含m个节点的增强层,求解每个增强层节点的本地权重,将本地权重低于1/k的节点重新生成随机森林,通过本地权重求解每个节点的输出权重;通过上述步骤增加增强层节点,更新输出权重;在上述前向运算训练过程中引入的淘汰制和输出权重快速更新方法,使得模型可以快速训练。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学,未经中国矿业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910494216.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于小样本的分类器训练方法
- 下一篇:基于相似子图匹配的在线马甲检测方法