[发明专利]基于深度学习的医学文献中关键句筛选方法及装置在审

专利信息
申请号: 201811188041.2 申请日: 2018-10-12
公开(公告)号: CN109472021A 公开(公告)日: 2019-03-15
发明(设计)人: 王则远;周旻;赵荣生;宋再伟 申请(专利权)人: 北京诺道认知医学科技有限公司;北京大学第三医院
主分类号: G06F17/27 分类号: G06F17/27
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 王莹;李相雨
地址: 100080 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 分句 医学 分词 词向量 筛选 卷积神经网络 标识编码 准确度 学习
【说明书】:

发明实施例公开一种基于深度学习的医学文献中关键句筛选方法及装置,能提高医学文献中关键句筛选的准确度。方法包括:S1、对待处理的医学文献进行分句,对分句进行分词,通过按照分词在所述待处理的医学文献中出现的顺序对分词进行标识编码,生成分句的词向量;S2、将所述分句的词向量输入预先训练好的基于深度学习的卷积神经网络模型中,得到所述待处理的医学文献中的关键句。

技术领域

本发明实施例涉及计算机领域,具体涉及一种基于深度学习的医学文献中关键句筛选方法及装置。

背景技术

文本中的主要内容往往涵盖在一组重要的关键句中,这些关键句能将文本的内容特征(例如领域类别、主题思想、中心意义等)鲜明的表示出来,正是基于这种认识,在信息检索、信息抽取和知识抽取等领域中,对能够表示文本主要内容的关键句识别与筛选是其中非常重要的一个步骤,其对学科文献的揭示、反映文本中隐含的知识等都具有重要的意义。关键句筛选简单来说就是根据一定的目的要求,通过计算机技术辨别并提取包含有用信息的句子,从而对文本进行浓缩从少量的数据中获得丰富的信息。

传统的关键句筛选方法一般基于统计方法,利用如位置、频数等统计信息找到最能代表文章主题的句子作为关键句。按照文章的结构划分,又可分为无结构筛选分析型和有结构筛选分析型。前者通过对文章的句子进行权重计算,找到权重排名靠前的句子作为关键句。后者首先对文章进行语义结构分析,找出文章的主题结构,然后从各个主题中分别抽取句子组成关键句。然而基于结构或者权重进行筛选的统计方法,在实际操作中容易忽略句子本身的内容,筛选掉在文中分布较小但是包含主题词内容的关键句,且冗余性较大。在自然语言处理领域应用较为广泛的深度学习算法关注点在句子内容本身,通过模拟人脑神经网络结构自动学习样本特征,从而筛选出包含关键信息的关键句,为进一步分析做准备。但是该算法迄今为止仅限于分析孤立的句子,句子与句子之间的上下文关系对本句的约束和影响还缺乏系统的研究。

发明内容

针对现有技术存在的不足和缺陷,本发明实施例提供一种基于深度学习的医学文献中关键句筛选方法及装置。

一方面,本发明实施例提出一种基于深度学习的医学文献中关键句筛选方法,包括:

S1、对待处理的医学文献进行分句,对分句进行分词,通过按照分词在所述待处理的医学文献中出现的顺序对分词进行标识编码,生成分句的词向量;

S2、将所述分句的词向量输入预先训练好的基于深度学习的卷积神经网络模型中,得到所述待处理的医学文献中的关键句。

另一方面,本发明实施例提出一种基于深度学习的医学文献中关键句筛选装置,包括:

生成单元,用于对待处理的医学文献进行分句,对分句进行分词,通过按照分词在所述待处理的医学文献中出现的顺序对分词进行标识编码,生成分句的词向量;

输入单元,用于将所述分句的词向量输入预先训练好的基于深度学习的卷积神经网络模型中,得到所述待处理的医学文献中的关键句。

第三方面,本发明实施例提供一种电子设备,包括:处理器、存储器、总线及存储在存储器上并可在处理器上运行的计算机程序;

其中,所述处理器,存储器通过所述总线完成相互间的通信;

所述处理器执行所述计算机程序时实现上述方法。

第四方面,本发明实施例提供一种非暂态计算机可读存储介质,所述存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述方法。

本发明实施例提供的基于深度学习的医学文献中关键句筛选方法及装置,利用训练好的基于深度学习的卷积神经网络模型筛选医学文献中的关键句,因构建的卷积神经网络模型能够结合上下文语义,捕捉到文献的局部相关性,从而使得本方案相较于现有技术能提高医学文献中关键句筛选的准确度。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京诺道认知医学科技有限公司;北京大学第三医院,未经北京诺道认知医学科技有限公司;北京大学第三医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811188041.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top