[发明专利]一种医学健康领域知识图谱的关系抽取方法及系统在审
申请号: | 201910293359.5 | 申请日: | 2019-04-12 |
公开(公告)号: | CN110059196A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 张晓红;封银曼;刘钇彤;高艳丽;张威 | 申请(专利权)人: | 张晓红 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/31;G06F16/33;G16H50/70;G16H70/20 |
代理公司: | 重庆市信立达专利代理事务所(普通合伙) 50230 | 代理人: | 包晓静 |
地址: | 450000 河南省郑*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图谱 关系抽取 领域知识 医学健康 更新模块 检索模块 视频 采集模块 分析模块 构建模块 关联模块 绘制模块 上级实体 图谱检索 显示模块 知识资源 主控模块 关联性 全面性 准确率 聚类 整合 检索 搜索 查询 挖掘 | ||
1.一种医学健康领域知识图谱的关系抽取系统,其特征在于,所述医学健康领域知识图谱的关系抽取系统包括:
知识资源采集模块、检索模块、主控模块、挖掘模块、分析模块、关联模块、整合构建模块、绘制模块、更新模块、显示模块;
知识资源采集模块,与主控模块连接,用于通过数据采集设备采集医学健康领域知识资源数据;
检索模块,与主控模块连接,用于通过检索程序检索目标健康知识资源;
主控模块,与知识资源采集模块、检索模块、挖掘模块、分析模块、关联模块、整合构建模块、绘制模块、更新模块、显示模块连接,用于通过单片机控制各个模块正常工作;
挖掘模块,与主控模块连接,用于通过挖掘程序对检索的健康知识进行挖掘操作;
分析模块,与主控模块连接,用于通过分析程序分析健康知识含义、类别;
关联模块,与主控模块连接,用于通过关联程序根据分析结果进行关联操作;
整合构建模块,与主控模块连接,用于通过构建程序构建知识关联模型;
绘制模块,与主控模块连接,用于通过绘制程序根据关联模型绘制出可视化的关联图谱;
更新模块,与主控模块连接,用于通过更新程序对健康知识图谱进行更新操作;
显示模块,与主控模块连接,用于通过显示器显示医学健康领域知识图谱。
2.一种如权利要求1所述的医学健康领域知识图谱的关系抽取方法,其特征在于,所述医学健康领域知识图谱的关系抽取方法包括以下步骤:
步骤一,通过知识资源采集模块利用数据采集设备采集医学健康领域知识资源数据;通过检索模块利用检索程序检索目标健康知识资源;
步骤二,主控模块通过挖掘模块利用挖掘程序对检索的健康知识进行挖掘操作;
步骤三,通过分析模块利用分析程序分析健康知识含义、类别;通过关联模块利用关联程序根据分析结果进行关联操作;
步骤四,通过整合构建模块利用构建程序构建知识关联模型;通过绘制模块利用绘制程序根据关联模型绘制出可视化的关联图谱;
步骤五,通过更新模块利用更新程序对健康知识图谱进行更新操作;
步骤六,通过显示模块利用显示器显示医学健康领域知识图谱。
3.如权利要求1所述医学健康领域知识图谱的关系抽取系统,其特征在于,所述检索模块检索方法如下:
(1)根据查询日志选取训练样本,对训练样本进行处理,建立查询问句与查询结构图之间的对应关系,根据所述对应关系训练得到语义识别模型,构建贝叶斯分类器;
(2)通过语义识别模型及贝叶斯分类器将用户输入的自然语言查询问句映射到最大概率的查询结构图上,并将所述查询结构图作为查询模式图进行知识图谱检索。
4.如权利要求3所述医学健康领域知识图谱的关系抽取系统,其特征在于,所述步骤(1)中,包括:
A、命名实体识别并实体标注所述训练样本中的查询问句,得到实体标签,根据所述实体标签挖掘对应的查询结构图,采用查询结构图对应的ID标注所述查询问句,得到实体标签对应的查询结构图标签;
B、语义标注所述步骤A中完成实体标注的查询问句,将查询问句的实体标签转换成对应的语义标签,建立语义标签和查询结构图标签之间的对应关系;
C、将包含语义标签的查询问句作为训练数据,采用训练工具进行训练,得到语义识别模型;
D、将包含语义标签和查询结构图标签的查询问句作为训练数据进行训练,得到贝叶斯分类器模型参数,构建贝叶斯分类器。
5.如权利要求1所述医学健康领域知识图谱的关系抽取系统,其特征在于,所述更新模块更新方法如下:
1)获取目标关键词;
2)从预先建立的知识图谱包括的表征健康知识的实体中,确定至少一个对应的属性信息与所述目标关键词相匹配的实体作为匹配实体;
3)建立所确定的至少一个匹配实体的上级实体,以及基于匹配实体的属性信息,生成所述上级实体的属性信息;
4)将所述上级实体和所述上级实体的属性信息加入所述知识图谱中。
6.如权利要求5所述医学健康领域知识图谱的关系抽取系统,其特征在于,所述目标关键词的数量为至少一个,用于表征健康知识的实体的属性信息包括用于描述视频的至少一个关键词;
所述从预先建立的知识图谱包括的表征健康知识的实体中,确定至少一个对应的属性信息与所述目标关键词相匹配的实体作为匹配实体,包括:
计算所获取的至少一个目标关键词与用于表征健康知识的实体对应的至少一个关键词之间的相似度,将大于等于预设的相似度阈值的相似度对应的实体确定为匹配实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于张晓红,未经张晓红许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910293359.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于LIS的医学检验知识图谱构建方法
- 下一篇:获取城市信息的方法及设备