[发明专利]实体关系挖掘方法及设备有效

专利信息
申请号: 201910514578.1 申请日: 2019-06-14
公开(公告)号: CN110287270B 公开(公告)日: 2021-09-14
发明(设计)人: 王春宇;夏源;施振辉;陆超;黄海峰 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06F16/28 分类号: G06F16/28;G06F16/2458;G16H50/70
代理公司: 北京同立钧成知识产权代理有限公司 11205 代理人: 朱颖;刘芳
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 实体 关系 挖掘 方法 设备
【说明书】:

发明实施例提供一种实体关系挖掘方法及设备,该方法包括:将预设疾病列表输入词向量模型,获得包括症状与对应疾病之间相似度的第一列表;从所述词向量模型导出包括每种症状对应的词频的症状词表;根据所述相似度和所述词频,确定所述第一列表中每种症状与对应疾病之间的第一概率,获得第二列表;根据所述第二列表和预设疾病科室列表,确定各症状与对应科室之间的第二概率,获得第三列表;将所述第三列表作为最终医学实体关系列表输出,以对原有的医学实体关系列表进行更新。本实施例提供的方法能够充分利用已有资源、快速准确的获得症状‑科室的医学实体关系列表,从而方便快捷的对医学实体关系列表进行及时更新和扩充。

技术领域

本发明实施例涉及数据挖掘技术领域,尤其涉及一种实体关系挖掘方法及设备。

背景技术

近几年来,人工智能技术得到了越来越广泛的关注,作为其子领域的机器学习、深度学习等方法也被应用到各行各业当中,不仅仅停留于理论阶段的研究,诸多企业将这一方法应用在实际的业务场景中,结合相关的技术,如图像检测、自然语言处理、模式识别等研发成实际的落地产品,尤其是现在许多互联网公司致力于AI医疗领域,研发出智能问诊、智能分导诊等互联网医疗领域的产品。随着人工智能技术在医学领域的广泛应用,人们对于智能分导诊中人机交互的信息准确性以及用户体验感有了越来越高的要求,医学实体关系表亟待扩充。

现有技术中通常采用医学人员手动标注的方式进行医学实体关系的挖掘。具体由医学人员们通过阅读大量的权威医学文献,人工的标注出里面的医学实体(疾病,症状等),找出各科室所对应的症状或疾病,凭个人经验给出症状对应该科室的转移概率。

然而,每个医学人员都有自己擅长的科室,很难做到擅长所有的领域,所以导致在标注症状到科室关系时会出现症状未覆盖的情况,并且单纯的通过人工的方式标注,非常繁琐,耗时很久。

发明内容

本发明实施例提供一种实体关系挖掘方法及设备,以提高实体关系挖掘的效率以及准确率。

第一方面,本发明实施例提供一种实体关系挖掘方法,包括:

将预设疾病列表输入词向量模型,获得第一列表;所述第一列表中包括每种疾病对应的多种症状分别与该疾病之间的相似度;

从所述词向量模型导出症状词表,所述症状词表包括每种症状对应的词频;

根据所述相似度和所述词频,确定所述第一列表中每种症状与对应疾病之间的第一概率,获得包括所述第一概率的第二列表;

根据所述第二列表和预设疾病科室列表,确定各症状与对应科室之间的第二概率,获得包括所述第二概率的第三列表;

将所述第三列表作为最终医学实体关系列表输出,以对原有的医学实体关系列表进行更新。

在一种可能的设计中,所述根据所述第二列表和预设疾病科室列表,确定各症状与对应科室之间的第二概率,获得包括所述第二概率的第三列表之后,还包括:

将所述第三列表中各症状输入深度学习模型,获得第四列表;所述第四列表包括每种症状与对应科室之间的第三概率;

针对第三列表中每个科室,对该科室对应所有第二概率进行分区,并分别对各分区内的第二概率进行分桶操作,确定每种症状与对应科室之间的第四概率,并获得包括该第四概率的第五列表;

根据预设融合策略,将所述第四列表中的第三概率和所述第五列表中的第四概率进行融合,获得第六列表;

所述将所述第三列表作为最终医学实体关系列表输出,以对原有的医学实体关系列表进行更新,包括:

将所述第六列表作为最终医学实体关系列表输出,以对原有的医学实体关系列表进行更新。

在一种可能的设计中,所述根据预设融合策略,将所述第四列表中的第三概率和所述第五列表中的第四概率进行融合,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910514578.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top