[发明专利]一种基于事件的神经影像学文献挖掘主题学习管道方法在审
申请号: | 202011226838.4 | 申请日: | 2020-11-06 |
公开(公告)号: | CN112417241A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 闫健卓;陈丽红;陈建辉;于涌川 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/335;G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 事件 神经 影像 文献 挖掘 主题 学习 管道 方法 | ||
1.一种基于事件的神经影像学文献挖掘主题学习管道方法,其特征在于,包括以下步骤:
步骤1:数据预处理;对从PLoS One网站上爬取到的论文数据进行停用词处理;
步骤2:预定义事件的表达;
步骤3:训练LSTM-CNN模型;首先通过Embedding Layer将单词转化为词向量,再输入LSTM进行语义特征提取,最后将LSTM的输出作为CNN的输入,进行进一步的特征提取;
步骤4:训练PCNN模型;通过向量表示,卷积,最大池化,分类四个部分获得关系的向量表示;
步骤5:构建neuroimaging Event-BTM主题学习管道,输入功能神经影像文献数据,获取该文献的主题表示结果;
步骤6:评价模型;使用模型评价指标评价模型性能。
2.根据权利要求1所述的一种基于事件的神经影像学文献挖掘主题学习管道方法,其特征在于:步骤1所述的数据预处理方法中的功能神经影像文献数据去除包含“the、a、an”在内的停用词。
3.根据权利要求1所述的一种基于事件的神经影像学文献挖掘主题学习管道方法,其特征在于:步骤2所述的预定义事件的表达,具体为:主题事件通过使用元事件来构造,元事件表示为“触发词+论元”的结构。
4.根据权利要求1所述的一种基于事件的神经影像学文献挖掘主题学习管道方法,其特征在于:步骤3所述的BiLSTM-CNN模型训练步骤包括:
步骤一:文本向量化;
vword=[vw,vc,vt,vchar]
其中,vword是句子中wordi的组合向量,vw,vc,vt,vchar分别是单词向量,大小写向量,术语词典以及字符向量;
步骤二:事件元素识别,对于一个句子S=[word1,word2,...,wordn],基于BiLSTM的特征建模过程描述如下:
其中,vword是句子中wordi的组合向量,fi是单词表示,wordi是句子中的单词,vword是句子中wordi的组合向量,hi是LSTM隐藏层的输出,基于BiLSTM的输出,log-softmax函数用于获取每种触发词或论元的对数概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011226838.4/1.html,转载请声明来源钻瓜专利网。