[发明专利]基于SEV-SDG-CNN的电子病历智能诊断方法有效
申请号: | 201910284998.5 | 申请日: | 2019-04-10 |
公开(公告)号: | CN110060749B | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 王华珍;李小整;何霆;吴谨准 | 申请(专利权)人: | 华侨大学 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G06F40/284;G06F40/30 |
代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 张松亭;李艾华 |
地址: | 362000 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于SEV‑SDG‑CNN的电子病历智能诊断方法,包括:挖掘医疗领域词汇来构建浅层语义词汇词典;基于浅层语义词汇生成文本语料中每一个词的浅层语义向量表达SEV;利用浅层语义词汇词典计算每一条语料的浅层语义预判模式SDG;将SEV和SDG融入传统CNN分类模型构建中,即在特征表达层将SEV与词嵌入向量进行拼接,在模式输出层将SDG和CNN判别模式进行融合,从而实现改进的SEV‑SDG‑CNN分类模型。本发明应用在电子病历疾病诊断中,能充分提取专业性极强、知识密度极高的电子病历所蕴含的大量丰富语义信息,并得益于CNN能从大数据中自动挖掘特征的优势,使得电子病历智能诊断方法具有较高的性能。 | ||
搜索关键词: | 基于 sev sdg cnn 电子 病历 智能 诊断 方法 | ||
【主权项】:
1.一种基于SEV‑SDG‑CNN的电子病历智能诊断方法,其特征在于,包括以下步骤:S1:输入电子病例文本语料D,采用结巴分词工具对语料进行分词;S2:基于步骤S1中得到的词语,利用word2vec工具生成每一个词qi的词向量表达Lw;S3:根据医学领域词汇构建电子病历浅层语义词汇词典Dict,如下:S31:从以下八个方面挖掘医学领域词汇:(1)开源词典Dopen;(2)否定副词词典Dnot;(3)程度副词词典Dadv;(4)网络词典Dnet;(5)符号词典Demoticon;(6)语气词词典Dmood;(7)领域词典Dprofession;(8)其他包括手工构建的词典Dother;S32:根据步骤S31的8种词汇来源构建电子病历的浅层语义词典Dict;S4:基于浅层语义词汇Dict,生成每一个词qi的浅层语义向量Sc=(xopen,xnot,xadv,xnet,xemoticon,xmood,xprofession,xother),区别于Lw中每个xi表示一个单独的元素,Sc中每个xi并不表示单个元素而是包含多个元素,其元素个数由对应词典规模大小决定;S5:将word2vec词向量表达Lw和浅层语义向量表达Sc进行拼接,生成深度学习输入向量[Lw:Sc];S6:计算浅层语义预判模式SDG,如下:S61:利用训练语料D计算出浅层语义词典Dict中每个浅层语义词汇属于每个类别的概率,形成浅层语义词汇概率表;S62:基于步骤S3中得到的浅层语义词典Dict,提取每条语料中的浅层语义词汇;S63:基于步骤S61得到的浅层语义词汇概率表和步骤S62得到的每条语料中的浅层语义词汇,利用求和归一化的方式计算出这条语料的预判概率,形成浅层语义预判模式SDG;S7:集成SEV和SDG的CNN分类模型构建,如下:S71:初始化CNN网络;S72:选取学习样本集D的任一样本(xx,y),其中,x代表一条文本语料,y代表其对应的标签;将语料x按照步骤S5构建合成向量[Lw:Sc],输入到CNN分类模型,得到其模式输出ρCNN;S73:基于步骤S6提出的浅层语义预判模式计算方法,计算出语料x对应的浅层语义预判模式输出ρSDG;S74:将ρCNN和ρSDG进行相加并归一化作为形成决策模式,进而输出针对语料x的预测结果y′;S75:根据语料x的真实标签y和预测结果y′的差距来对CNN模型进行参数优化;S76:基于步骤S75中已经训练好的CNN网络,将一条被测语料x送入CNN进行前向传播计算,得到其预测类别y′。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学,未经华侨大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910284998.5/,转载请声明来源钻瓜专利网。