[发明专利]一种基于事件的神经影像学文献挖掘主题学习管道方法在审

专利信息
申请号: 202011226838.4 申请日: 2020-11-06
公开(公告)号: CN112417241A 公开(公告)日: 2021-02-26
发明(设计)人: 闫健卓;陈丽红;陈建辉;于涌川 申请(专利权)人: 北京工业大学
主分类号: G06F16/951 分类号: G06F16/951;G06F16/335;G06N3/04;G06N3/08
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 沈波
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 事件 神经 影像 文献 挖掘 主题 学习 管道 方法
【权利要求书】:

1.一种基于事件的神经影像学文献挖掘主题学习管道方法,其特征在于,包括以下步骤:

步骤1:数据预处理;对从PLoS One网站上爬取到的论文数据进行停用词处理;

步骤2:预定义事件的表达;

步骤3:训练LSTM-CNN模型;首先通过Embedding Layer将单词转化为词向量,再输入LSTM进行语义特征提取,最后将LSTM的输出作为CNN的输入,进行进一步的特征提取;

步骤4:训练PCNN模型;通过向量表示,卷积,最大池化,分类四个部分获得关系的向量表示;

步骤5:构建neuroimaging Event-BTM主题学习管道,输入功能神经影像文献数据,获取该文献的主题表示结果;

步骤6:评价模型;使用模型评价指标评价模型性能。

2.根据权利要求1所述的一种基于事件的神经影像学文献挖掘主题学习管道方法,其特征在于:步骤1所述的数据预处理方法中的功能神经影像文献数据去除包含“the、a、an”在内的停用词。

3.根据权利要求1所述的一种基于事件的神经影像学文献挖掘主题学习管道方法,其特征在于:步骤2所述的预定义事件的表达,具体为:主题事件通过使用元事件来构造,元事件表示为“触发词+论元”的结构。

4.根据权利要求1所述的一种基于事件的神经影像学文献挖掘主题学习管道方法,其特征在于:步骤3所述的BiLSTM-CNN模型训练步骤包括:

步骤一:文本向量化;

vword=[vw,vc,vt,vchar]

其中,vword是句子中wordi的组合向量,vw,vc,vt,vchar分别是单词向量,大小写向量,术语词典以及字符向量;

步骤二:事件元素识别,对于一个句子S=[word1,word2,...,wordn],基于BiLSTM的特征建模过程描述如下:

其中,vword是句子中wordi的组合向量,fi是单词表示,wordi是句子中的单词,vword是句子中wordi的组合向量,hi是LSTM隐藏层的输出,基于BiLSTM的输出,log-softmax函数用于获取每种触发词或论元的对数概率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011226838.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top