[发明专利]一种基于人工智能的科研论文管理方法及系统在审

专利信息
申请号: 202110581579.5 申请日: 2021-05-27
公开(公告)号: CN113160016A 公开(公告)日: 2021-07-23
发明(设计)人: 石建 申请(专利权)人: 南通大学
主分类号: G06Q50/20 分类号: G06Q50/20;G06Q10/10;G06F16/951;G06K9/00;G06N3/04
代理公司: 南京瑞弘专利商标事务所(普通合伙) 32249 代理人: 徐激波
地址: 226000*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 人工智能 科研 论文 管理 方法 系统
【权利要求书】:

1.一种基于人工智能的科研论文管理系统,其特征在于,包括服务器;所述服务器内包括有人工智能图像识别模块、信息录入子模块以及信息审核子模块;所述人工智能图像识别模块用于显示全部、学校通过/不通过和暂存的信息、显示管理模块中的信息列表、显示站内消息和微信小程序信息及显示科研论文管理状态;所述信息录入子模块用于显示录入的科研信息、通过交互显示科研信息的管理状态、发送审核微信小程序消息和站内消息;所述信息审核子模块用于审核科研信息、通过交互界面显示科研信息的审核状态、发送微信小程序消息和站内消息。

2.根据权利要求1所述的一种基于人工智能的科研论文管理系统,还包括管理模块,其特征在于,所述信息录入子模块以及信息审核子模块为管理模块的其中两种模块;所述信息录入子模块可显示录入的科研信息,经对比修改录入科研信息后,通过点击“提交”,进入信息审核子模块;若审核通过,交互界面显示的申请表状态为“学校通过”,并同时给申请人发送站内消息和微信小程序消息;若审核不通过,交互界面显示的申请表状态为“学校不通过”,并同时给申请人发送站内消息和微信小程序消息。

3.根据权利要求1所述的一种基于人工智能的科研论文管理系统,其特征在于,所述通过交互显示科研信息的管理状态包括“全部”、“学校通过”、“学校不通过”和“暂存”。

4.一种基于人工智能的科研论文管理方法,其特征在于,包括以下步骤;

步骤一:服务器端,自动爬取论文服务运行爬取论文后,对爬取的论文进行人工智能图片识别,提取科研论文信息并保存到识别结果库中;

步骤二:在客户端点击科研动态—我的成果—所有推送;

步骤三:在所有推送中可以查看到系统自动推送过来的论文;

步骤四:点击对应论文下的认领按钮,即可弹出认领确认交互页面。点击忽略即可忽略,但仍可以取消忽略;

步骤五:在确认交互页面选择作者顺序、姓名等一系列信息后点击确认即可保存到暂存中;

步骤六:在暂存操作一栏可以对科研论文进行提交、编辑和删除等操作,点击提交即可等待审核,点击编辑就是对人工智能自动填充录入的科研信息进行修改,点击删除就是在暂存中删除信息退回至推送;

步骤七:审核人员按照提交的科研论文信息与识别结果库中的论文信息自动对比,看出修改的地方,若审核通过,在所有成果列表界面显示的状态为“学校通过”,并同时给申请人发送站内消息,同时也会从微信小程序端进行推送,并将科研论文保存在校级、院级和个人及参与者库中;若审核不通过,在所有成果的纵向项目列表界面显示的状态为“学校不通过”,并同时给申请人发送站内消息,同时也会从微信小程序端进行推送。

5.根据权利要求4所述的一种基于人工智能的科研论文管理方法,其特征在于,所述步骤一的图像识别通过爬取的科研论文,经过CTPNCRNN人工智能服务后,自动识别并提取科研论文信息保存在识别结果库中并推送给著作者。

6.根据权利要求4和5所述的一种基于人工智能的科研论文管理方法,其特征在于,所述图像识别基于CTPN-53+CRNN网络结构的模型,用来提取科研论文的信息,然后自动录入;

CTPN-53,这里是CTPN变种,检测横向排列的文字信息,输入一张项目书图片:

·首先通过Darknet-53网络提取特征,获得大小为1*C*H*W(C是通道数,H是图片高度,W是图片宽度)的conv5 feature map;

·之后在conv5上做3*3的滑动窗口,即每个点都结合周围3*3区域特征获得一个长度为3*3*C的特征向量;输出1*9C*H*W的feature map,该特征显然只有CNN学习到的空间特征;

·接着将feature map进行Reshape:1*9C*H*W→(1*H)*W*9C

·然后以N=1,所以Batch批次=NH且最大时间长度T=W的数据流输入双向LSTM,学习每一行的序列特征;双向LSTM输出NH*W*256,再Reshape恢复形状:NH*W*256→N*256*H*W,该特征既包含空间特征,也包含了LSTM学习到的序列特征;

·然后经过全连接卷积层,变为N*512*H*W的特征,最后经过类似Faster R-CNN的RPN网络,获得text proposals,即文本信息;

CTPN-53有3种输出,文本/非文本得分,垂直坐标V={vG,vk}和左右水平偏移量O;CTPN包含3个损失函数,分类损失函数,用softmax loss区分是否为文本,和均是回归函数,用L1函数计算;总损失函数如下:

其中=1,λ2=2

·接着将拿到的text proposals进行文字识别,本发明使用CRNN-53CTC的网络架构进行识别;

·CRNN分为三部分:卷积层、循环网络层、转录输出层;

其中卷积层就是普通的CNN网络用来提取图像特征,循环网络层就是一个BI-LSTM,旨在卷积后继续提取文字序列特征,输出层即为将RNN输出做softmax后,为字符输出;

CTC,将上面获得的CRNN结果送入CTC算法模型,CTC算法是一种完全端到端的模型训练,不需要预先对数据做对齐,只需要一个输入序列和一个输出序列即可以训练;这样就不需要对数据对齐和一一标注,并且CTC直接输出序列预测的概率,不需要外部的后处理;CTC引入了blank,每个预测的分类对应的一整段文本中的一个spike,其他不是尖峰的位置认为是blank。对于一段文本,CTC最后的输出是spike的序列,并不关心每一个单词持续了多长时间;CTC是通过梯度调整LSTM的ω参数,使得p(l|x)取得最大;(p(l|x)是给定输入x的情况下,输出l的概率,ω是LSTM隐藏层参数);从而得到处理后的文本信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110581579.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top