[发明专利]基于药品说明书的合理用药知识图谱构建方法在审
申请号: | 201910593831.7 | 申请日: | 2019-07-03 |
公开(公告)号: | CN110377755A | 公开(公告)日: | 2019-10-25 |
发明(设计)人: | 刘云;张小亮;王永庆;徐骏捷;叶欣;单涛;卢珊;胡杰;王忠民 | 申请(专利权)人: | 江苏省人民医院(南京医科大学第一附属医院) |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F17/27;G16H70/40;G06N20/00 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李淑静 |
地址: | 210029 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标注 合理用药 构建 机器学习 图谱构建 图谱 知识库 机器学习模型 自然语言处理 半监督学习 临床用药 训练机器 用药差错 规则库 标引 抽取 自动化 归纳 预测 防范 医疗 学习 | ||
本发明公开了一种基于药品说明书的合理用药知识图谱构建方法,包括以下步骤:S10、抽取药品说明书,通过专家标注法对其中的实体和关系进行归纳,形成实体和关系标引规则库;S20、通过半监督学习方法,基于专家标注的数据以及机器学习规则训练机器学习模型;S30、使用已训练好的机器学习模型,对未标注的药品说明书进行预测标注,形成药品关系的知识图谱。本发明利用自然语言处理和知识图谱技术,基于药品说明书构建合理用药知识库,能够有助于规避用药差错,防范医疗风险,提高临床用药安全性。本发明的方法具备自动化构建能力,通过机器学习提高构建精度。
技术领域
本发明涉及知识图谱领域,特别是涉及一种基于药品说明书的合理用药知识图谱构建方法。
背景技术
随着科学的进步与时代的发展,知识爆炸对医师工作提出了严峻挑战,医学领域的知识更新和增长,也超出了医师的学习和掌握限度。药物的多样性和患者不同的病理特点使药物治疗复杂化,多种因素都会对用药种类和剂量产生影响,单纯靠医师的个人判断力往往不够。传统合理用药系统中药学知识库主要依靠专业人员手工构建,人力成本较高,知识库准确度也不高,无法满足医院电子处方审核的要求。
知识图谱包含了丰富的语义信息,以结构化的形式来表示真实世界中的实体或概念以及它们之间的关联关系,其本质是一张巨大的语义网络图,将海量知识以更直观的方式展示在用户面前。目前知识图谱在互联网搜索及信息推荐系统中有较成熟的应用,但在药品领域尚无成熟公开的药品知识图谱。现有技术中虽然也有药品知识图谱的构建方法,但这些知识图谱都是依靠人工或正则表达式规则提取结构化数据来构建,人工的方法虽然提取的结构化知识比较精确,但是消耗人力、时间较多,并且人工长时间操作容易引起疲劳造成误差。基于正则表达式规则的方法依靠机器虽然比较节省时间,但是正则方法只适合简单的规则,针对中文的复杂情况,正则表达式的误差会比较高。
药品说明书是药品情况说明重要来源之一,也是医师、药师、护师和病人治疗用药时的科学依据,但是目前基于国内外药品说明书所有药物实体关系(包含给药途径、重复用药、药物相互作用、适应症、不良反应、禁忌症、老年用药、儿童用药、妊娠用药等)构建药物-诊断-临床诊疗数据进行推理的知识图谱的研究还很少。
发明内容
发明目的:针对现有技术的不足,本发明提出一种基于药品说明书的合理用药知识图谱构建方法,基于机器学习算法总结归纳出完整的药品实体和关系,提高合理用药知识图谱构建自动化程度和精度,保障患者用药安全。
技术方案:本发明所述的一种基于药品说明书的合理用药知识图谱构建方法,包括以下步骤:
S10、抽取药品说明书,通过专家标注法对其中的实体和关系进行归纳,形成实体和关系标引规则库;
S20、通过半监督学习方法,基于专家标注的规则以及机器学习规则训练机器学习模型;
S30、使用已训练好的机器学习模型,对未标注的药品说明书进行预测标注,并形成药品关系的知识图谱。
进一步地,所述步骤S10包括:
S11、通过网络爬虫爬取医药网站的药品说明书,并保存到本地;
S12、针对爬取的数据进行命名实体识别与关系抽取,形成实体1、实体2、……、实体n和关系1、关系2、……、关系n的标引规则库;
S13、以药品名称作为第一实体,药品说明书中识别的实体作为第二实体,其与药品名称对应的关系作为关系,得到<第一实体-关系-第二实体>这样的三元组数据。
得到三元组数据后,使用Neo4j图形数据库存储数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏省人民医院(南京医科大学第一附属医院),未经江苏省人民医院(南京医科大学第一附属医院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910593831.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于决策树的数据库本体学习优化方法
- 下一篇:海量数据集事件关系抽取方法