[发明专利]药物研发知识库构建方法及装置有效
申请号: | 202110025086.3 | 申请日: | 2021-01-08 |
公开(公告)号: | CN112347204B | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 丁红霞;伍星;吴忠毅;苑敬;王雨福;李靖;李琪;廖宛玲 | 申请(专利权)人: | 药渡经纬信息科技(北京)有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G16C20/90 |
代理公司: | 北京智桥联合知识产权代理事务所(普通合伙) 11560 | 代理人: | 金光恩 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 药物 研发 知识库 构建 方法 装置 | ||
1.一种药物研发知识库构建方法,其特征在于,所述方法包括:
建立医学实体库,所述医学实体库中包括医学实体及实体属性;所述医学实体包括:核心实体和一般实体;所述核心实体为药物,所述一般实体为与药物相关的实体;确定实体关系;所述实体关系包括:同类型实体间关系、不同类型实体间关系;
以所述核心实体为关键节点、所述一般实体为普通节点,根据所述实体关系建立对应所述医学实体库的知识图谱;其中核心实体串联各个一般实体,一般实体与核心实体存在关联关系,所述关联关系由使用专业词汇表及AC自动机算法抽取各语料段落中的实体,根据预置规则,填充核心实体与一般实体间,同类实体间的关系;
其中所述实体属性采用关系型数据库进行存储,所述实体关系采用图数据库进行存储,所述图数据库进一步存储实体的字段信息,采用图数据库进行知识推理;
其中,所述一般实体包括:靶点,适应症、公司;所述同类型实体间关系包括:药物实体关系、公司实体关系;所述药物实体关系包括:协同作用、拮抗作用;所述公司实体关系包括:母公司、子公司、分公司;业务领域的合作、转让和受让;所述不同类型实体间关系包括:药物与适应症的关系、药物与靶点的关系、药物与公司的关系;所述公司实体关系用于描述药物研发历史和商业情报信息;
其中适应症实体,是通过对多个临床源信息进行医学实体标定;对备用实体词条进行周期性频次分析,如果出现频次低于设定阈值的词条进行近似映射,将下级词条近似为上级词条,作为备用数据;如果出现频次大于等于设定阈值,则启用备用实体词条,并将其映射到MeSH层级结构;如果备用数据从各个归一化数据源出现频次超过阈值时,将备用数据从备用实体词条转换为正式的适应症词条。
2.根据权利要求1所述的方法,其特征在于,所述建立医学实体库包括:
从医学相关的结构化数据中抽取医学实体,建立医学实体库;
采集医学相关语料;
从所述语料中抽取医学实体,并将抽取的医学实体补充到所述医学实体库中。
3.根据权利要求2所述的方法,其特征在于,所述采集医学相关语料包括:
从以下任意一种或多种数据源采集医学相关语料:医学相关的文献、专利、新闻、网页。
4.根据权利要求2所述的方法,其特征在于,所述确定实体关系包括以下任意一种或多种方式:
采用基于规则的方法从所述医学相关语料中抽取实体关系;
采用基于深度学习模型的方法从所述医学相关语料中抽取实体关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于药渡经纬信息科技(北京)有限公司,未经药渡经纬信息科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110025086.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:液体全自动分装设备
- 下一篇:模块化全自动生化分析仪及其使用方法