[发明专利]基于药品说明书的合理用药知识图谱构建方法在审
申请号: | 201910593831.7 | 申请日: | 2019-07-03 |
公开(公告)号: | CN110377755A | 公开(公告)日: | 2019-10-25 |
发明(设计)人: | 刘云;张小亮;王永庆;徐骏捷;叶欣;单涛;卢珊;胡杰;王忠民 | 申请(专利权)人: | 江苏省人民医院(南京医科大学第一附属医院) |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F17/27;G16H70/40;G06N20/00 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李淑静 |
地址: | 210029 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标注 合理用药 构建 机器学习 图谱构建 图谱 知识库 机器学习模型 自然语言处理 半监督学习 临床用药 训练机器 用药差错 规则库 标引 抽取 自动化 归纳 预测 防范 医疗 学习 | ||
1.一种基于药品说明书的合理用药知识图谱构建方法,其特征在于,包括以下步骤:
S10、抽取药品说明书,通过专家标注法对其中的实体和关系进行归纳,形成实体和关系标引规则库;
S20、通过半监督学习方法,基于专家标注的规则以及机器学习规则训练机器学习模型;
S30、使用已训练好的机器学习模型,对未标注的药品说明书进行预测标注,形成药品关系的知识图谱。
2.根据权利要求1所述的基于药品说明书的合理用药知识图谱构建方法,其特征在于,所述步骤S10包括:
S11、通过网络爬虫爬取医药网站的药品说明书,并保存到本地;
S12、针对爬取的数据进行命名实体识别与关系抽取,形成实体1、实体2、……、实体n和关系1、关系2、……、关系n的标引规则库;
S13、以药品名称作为第一实体,药品说明书中识别的实体作为第二实体,其与药品名称对应的关系作为关系,得到<第一实体-关系-第二实体>这样的三元组数据,使用Neo4j图形数据库存储数据。
3.根据权利要求2所述的基于药品说明书的合理用药知识图谱构建方法,其特征在于,所述步骤S10还包括:在知识图谱构建后,搭配分词、检索、排除、统计算法,在知识图谱中搜索,合并知识图谱中的冗余节点,删除无用节点。
4.根据权利要求2所述的基于药品说明书的合理用药知识图谱构建方法,其特征在于,所标注的实体包括:药品名称、商品名、化学名称、英文名、汉语拼音、成分-主要成分、成分-分子式、成分-分子量、成分-复方成分、成分-辅料、成分-含量、性状、规格、生产企业、批准文号、不良反应-疾病、贮藏-温度-光照-湿度、用法用量-起始剂量-低值、相互作用-其他、注意事项-检验相关、药物禁忌-人群、不良反应-症状、用法用量-疾病状态-低值、相互作用-药品名称、适应症-疾病类别、相互作用-结果、药品名称、药物禁忌-禁用、相互作用-药品类别、用法用量-给药频次-低值、规格、给药途径、注意事项-人群、注意事项-疾病相关、用法用量-疾病名称。
5.根据权利要求2所述的基于药品说明书的合理用药知识图谱构建方法,其特征在于,所抽取的关系包括:主要成分、药物间相互作用、适应症、禁忌症、不良反应。
6.根据权利要求5所述的基于药品说明书的合理用药知识图谱构建方法,其特征在于,所述药物相互作用关系包括:相互作用药品名称导致关系、相互作用药品类别协同关系、相互作用药品类别导致关系、互作用药品类别拮抗关系、相互作用药品名称拮抗关系。
7.根据权利要求2所述的基于药品说明书的合理用药知识图谱构建方法,其特征在于,所述关系的抽取方法包括:直接提取关系和基于机器学习的文本分类法提取关系。
8.根据权利要求1所述的基于药品说明书的合理用药知识图谱构建方法,其特征在于,所述步骤S20中机器学习模型包括:CRF,BiLSTM,BERT中的任一种或多种。
9.根据权利要求8所述的基于药品说明书的合理用药知识图谱构建方法,其特征在于,所述机器学习模型训练时通过最大化对数似然函数来求解模型的最优参数。
10.根据权利要求1所述的基于药品说明书的合理用药知识图谱构建方法,其特征在于,所述步骤S30包括:根据机器学习模型的预测结果,得到相应药品说明书的标注规则,根据这些规则得到三元组;将由机器学习模型产生的三元组与领域专家标注产生的三元组一起导入Neo4j图数据库中,得到最终产生的知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏省人民医院(南京医科大学第一附属医院),未经江苏省人民医院(南京医科大学第一附属医院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910593831.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于决策树的数据库本体学习优化方法
- 下一篇:海量数据集事件关系抽取方法