[发明专利]基于摘要语义分析的计算机视觉类论文内容判别方法及系统有效
申请号: | 201910644291.0 | 申请日: | 2019-07-17 |
公开(公告)号: | CN110362673B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 陈星;郭晨皓;李鸣 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F40/30;G06F40/289;G06F40/284 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈明鑫;蔡学俊 |
地址: | 350108 福建省福州市闽*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 摘要 语义 分析 计算机 视觉 论文 内容 判别 方法 系统 | ||
1.一种基于摘要语义分析的计算机视觉类论文内容判别方法,其特征在于,包括如下步骤:
步骤S1、针对输入的计算机视觉类论文的摘要进行预处理,而后,根据预处理结果完成机器学习模型结构名称的提取;
步骤S2、首先,提取计算机视觉类论文的关键词组,并将提取到的关键词组中的所有词都加入一个单词集合;而后,为每一个研究领域类别设计单词表,并对每一个单词表中的每个单词设计权重,统计单词集合在每一个单词表中的得分,最大的得分对应的类别即为研究领域类别;
步骤S3、根据步骤S2得到的关键词组构建备选关键词组集,而后,根据步骤S2确定的研究领域类别及其对应的单词表和权重,对备选关键词组集中的所有词组计算得分,最高得分的关键词组即为概述摘要的目标关键词组;
所述步骤S1具体实现如下:
步骤S11、预处理:针对输入的计算机视觉类论文的摘要进行预处理,包括将段落形式的摘要切分成句子,再将句子由自然语言处理工具corenlp进行分词和依存分析的操作;
步骤S12、构建基于依存树的名称关键词提取模型:根据分词的结果顺序排列的词列表和依存分析的结果依存树,以关键词'network','Network','NETWORK'为起点向前回溯查找依存关系为amod,numod,det,acomp,nmod且父节点为关键词的词语加入代表机器学习模型结构名称的词列表中,完成机器学习模型结构名称的提取;
所述步骤S2具体实现如下:
步骤S21、提取关键词组,设计八种提取模型及其对应的触发模型的关键词:
提取模型一:首句主语,首句依存树的根节点的依存对象即是句子的主语;
提取模型二:关键词及其依存为修饰关系的词语;
提取模型三:关键词由case/mark 关系关联的目标短语;
提取模型四:及物动词关键词的直接宾语;
提取模型五:修饰动词关键词直接宾语的从句作为目标词组;
提取模型六:for引导的短语作为目标短语;
提取模型七:根节点为及物动词引导的宾语作为目标短语;
提取模型八:根节点为非及物动词引导的宾语或动词短语作为目标短语;
而后,将提取到的关键词组中的所有词都加入一个单词集合,集合中单词不重复;
步骤S22、判别研究领域:为每一个研究领域类别设计单词表,并对每一个单词表中的每个单词设计权重,统计步骤S21得到的单词集合在每一个单词表中的得分,最大的得分对应的类别即为研究领域类别。
2.根据权利要求1所述的一种基于摘要语义分析的计算机视觉类论文内容判别方法,其特征在于,所述步骤S3具体实现如下:
步骤S31、构建备选关键词组集:根据步骤S22中关键词组构建备选关键词组集;
步骤S32、判别目标关键词组:由步骤S22中确定的研究领域类别及其对应的单词表和权重,对备选关键词组集中的所有词组计算得分,最高得分的关键词组即为概述摘要抽取的目标关键词组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910644291.0/1.html,转载请声明来源钻瓜专利网。