[发明专利]基于深度学习和知识图谱获取医学同义词的系统及方法在审

专利信息
申请号: 201910530633.6 申请日: 2019-06-19
公开(公告)号: CN110287337A 公开(公告)日: 2019-09-27
发明(设计)人: 高敏;李国强;孙炜 申请(专利权)人: 上海交通大学;因何科技(上海)有限责任公司
主分类号: G06F16/36 分类号: G06F16/36;G06F16/33;G06F17/27;G06F16/951
代理公司: 上海交达专利事务所 31201 代理人: 王毓理;王锡麟
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 同义词 公共元素 统计模块 图谱 词向量 相似度计算模块 医学 计算模块 生成模块 图谱信息 候选同义词 输入文本 信息输出 准确度 相似度 传输 输出 学习 统计 分析
【说明书】:

一种基于深度学习和知识图谱获取医学同义词的系统及方法,包括:知识图谱生成模块、词向量计算模块、相似度计算模块以及公共元素统计模块,知识图谱生成模块与公共元素统计模块相连并传输知识图谱信息,词向量计算模块从对输入文本进行分析并识别出医学实体并将词向量信息输出至相似度计算模块,相似度计算模块根据知识图谱信息和医学实体的词向量信息及其互相之间的相似度得到候选同义词并输出至公共元素统计模块,公共元素统计模块通过统计公共元素的方式从中选出最终同义词。本发明利用知识图谱更加准确的定位到同义词,从而获取的同义词准确度有很大的提升。

技术领域

本发明涉及的是一种语义识别领域的技术,具体是一种基于深度学习和知识图谱获取医学同义词的系统及方法。

背景技术

随着人工智能技术在医疗领域越来越广泛的应用,越来越多的产品使用人机交互的方式来帮助病人进行病情分析,从而提高医生的诊断效率和准确度。主要为获取病人的主诉信息,并对主诉信息进行语义分析,选择合适的流程进行问诊,并得出结论。这其中,对主诉信息的理解主要表现为病人主诉信息中所涉及的医学实体和内部数据库中的标准医学实体的匹配,即寻找医学同义词,这是当前技术的一个主要难点。

对于获取同义词问题,现有方法主要是采用word2vec模型和计算余弦相似度,但是word2vec模型是基于上下文相似的词所表达的词义也是相似的这种假设,所以最后得到的相似度只能说明这两个单词在语料中的上下文的相似程度,并不是这两个词的语义相似度。

发明内容

本发明针对现有技术存在的上述不足,提出一种基于深度学习和知识图谱获取医学同义词的系统及方法,利用主诉中的相关信息在知识图谱中更加准确的定位到同义词,从而获取的同义词准确度有很大的提升。

本发明是通过以下技术方案实现的:

本发明涉及一种基于深度学习和知识图谱获取医学同义词的系统,包括:知识图谱生成模块、词向量计算模块、相似度计算模块以及公共元素统计模块,其中:知识图谱生成模块与公共元素统计模块相连并传输知识图谱信息,词向量计算模块从对输入文本进行分析并识别出医学实体并将词向量信息输出至相似度计算模块,相似度计算模块根据医学实体的词向量信息及其互相之间的相似度得到候选同义词并输出至公共元素统计模块,公共元素统计模块通过统计公共元素的方式从中选出最终同义词。

附图说明

图1为本发明流程示意图;

图2为实施例深层双向语言模型示意图;

图3为实施例从候选词中选择同义词示意图。

具体实施方式

如图3所示,本实施例包括以下步骤:

步骤101,获取医学数据:各大医学网站和移动客户端进行爬虫和下载医学论文、医学书籍、医学词典、电子病历、医学标准术语集(例如medDRA,ICD-10)等。

所述的爬虫是指:按照一定的规则,自动地抓取万维网信息的程序或者脚本。

步骤102,数据预处理:利用所获得的医学词典和标准术语集构建分词词典和停用词表,结合分词技术和命名实体识别技术(ner)对医学文本进行准确分词。

所述的分词技术采用但不限于基于Python的中文分词组件”Jieba”得以实现,其具体如:https://github.com/fxsjy/jieba中记载的方法。

所述的命名实体识别技术采用但不限于《Chinese NER Using Lattice LSTM》(Zhang,Yue,Yang,Jie,ACL 2018)中记载的方法实现。

步骤103,构建医学知识图谱:利用从医学文本中所提取的医学实体和关系构建医学知识图谱。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学;因何科技(上海)有限责任公司,未经上海交通大学;因何科技(上海)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910530633.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top